Conception de Systèmes Intelligents pour la Télémédecine...

170
epartement Informatique ´ Ecole Doctorale Informatique et Information pour la Soci´ et´ e Conception de Syst` emes Intelligents pour la T´ el´ em´ edecine Citoyenne Th` ese pr´ esent´ ee et soutenue publiquement le 29 Septembre 2006 pour l’obtention du Doctorat de l’INSA de Lyon (sp´ ecialit´ e informatique) par Hussein Atoui Composition du jury Rapporteurs : Fran¸coisCharpillet Directeur de Recherche INRIA Jo¨ el Colloc Professeur, Universit´ e du Havre Directeurs de th` ese : Paul Rubel Professeur, INSA de Lyon Directeur de l’INSERM ERM107 Jocelyne Fayn Ing´ enieur de Recherche, INSERM Examinateur Jean-Pierre Boissel Professeur, D´ epartement de Pharmacologie Clinique Facult´ e RTH Laennec INSERM ERM 107, MTIC (M´ ethodologies de Traitement de l’Information en Cardiologie)

Transcript of Conception de Systèmes Intelligents pour la Télémédecine...

Departement Informatique Ecole Doctorale Informatique et Information pour la Societe

Conception de Systemes Intelligentspour la Telemedecine Citoyenne

Thesepresentee et soutenue publiquement le 29 Septembre 2006

pour l’obtention du

Doctorat de l’INSA de Lyon(specialite informatique)

par

Hussein Atoui

Composition du juryRapporteurs : Francois Charpillet Directeur de Recherche INRIA

Joel Colloc Professeur, Universite du HavreDirecteurs de these: Paul Rubel Professeur, INSA de Lyon

Directeur de l’INSERM ERM107Jocelyne Fayn Ingenieur de Recherche, INSERM

Examinateur Jean-Pierre Boissel Professeur, Departement de Pharmacologie CliniqueFaculte RTH Laennec

INSERM ERM 107, MTIC (Methodologies de Traitement de l’Information en Cardiologie)

A ma famille, mes amis, mon village, mon sud,A tous les etres chers perdus victimes de la barbarie quia ravage le Liban dans l’indifference et la complicite du

monde entier,

A tous celles et ceux qui m’ont aide pendant ces annees, un grand Merci.

Table des matieres

Table des matieres vi

I Introduction 1

II Aide a la decision en medecine, le projet europeen EPI-MEDICS 5

1 Maladies cardiovasculaires, telemedecine et aide a la decision 61.1 Contexte medical . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.1.1 Le diagnostic . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2 L’electrocardiologie quantitative . . . . . . . . . . . . . . . . . . . . . . . . 7

1.2.1 L’ECG standard 12D . . . . . . . . . . . . . . . . . . . . . . . . . . 81.2.2 L’ECG : les differentes ondes et les intervalles de temps . . . . . . . 91.2.3 L’ECG, outil de detection du dysfonctionnement cardiaque . . . . . 9

1.3 La telemedecine citoyenne : le projet EPI-MEDICS . . . . . . . . . . . . . 141.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141.3.2 Evolution : passe, present et futur . . . . . . . . . . . . . . . . . . . 151.3.3 EPI-MEDICS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

1.4 L’aide a la decision en medecine . . . . . . . . . . . . . . . . . . . . . . . . 201.4.1 Generalites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201.4.2 Les systemes d’aide a la decision . . . . . . . . . . . . . . . . . . . 201.4.3 Les principales approches utilisees pour l’aide a la decision . . . . . 211.4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

III Conception, validation et strategies de deploiement de laplateforme decisionnelle d’EPI-MEDICS 25

2 Aide a la decision en telecardiologie 262.1 Contexte et objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262.2 Interpretation automatique de l’ECG . . . . . . . . . . . . . . . . . . . . . 27

2.2.1 Les reseaux de neurones . . . . . . . . . . . . . . . . . . . . . . . . 282.2.2 Conception, realisation et evaluation du module d’interpretation de

l’ECG par reseaux de neurones . . . . . . . . . . . . . . . . . . . . 34

iv

2.2.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452.3 Quantification du risque cardiovasculaire par approche probabiliste . . . . 48

2.3.1 Choix methodologiques . . . . . . . . . . . . . . . . . . . . . . . . . 502.3.2 Les reseaux bayesiens . . . . . . . . . . . . . . . . . . . . . . . . . . 522.3.3 Apprentissage des reseaux bayesiens . . . . . . . . . . . . . . . . . . 592.3.4 Configuration du modele probabiliste de stratification du risque car-

diovasculaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 602.3.5 La base de donnees INDANA . . . . . . . . . . . . . . . . . . . . . 612.3.6 Realisation du reseau bayesien . . . . . . . . . . . . . . . . . . . . . 622.3.7 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642.3.8 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642.3.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

2.4 Vers un modele multi-classifieurs multi-modules du diagnostic de l’infarc-tus : Interaction du module neuronal et du module bayesien dans le pro-cessus decisionnel global . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

3 Acquisition de l’ECG PEM et synthese de l’ECG standard 683.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 683.2 Modalites d’acquisition de l’ECG PEM . . . . . . . . . . . . . . . . . . . . 693.3 Approches conventionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . 713.4 Choix methodologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 723.5 Bases de donnees d’apprentissage et de test . . . . . . . . . . . . . . . . . . 733.6 Configuration du modele de synthese de l’ECG standard 12D par reseaux

de neurones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 743.6.1 Constitution des ensembles d’apprentissage et de test . . . . . . . . 743.6.2 Evaluation de la variation naturelle intra-patients entre les ECG de

reference et les ECG d’urgence . . . . . . . . . . . . . . . . . . . . . 743.6.3 Configuration de la structure des reseaux de neurones . . . . . . . . 753.6.4 Processus d’apprentissage et d’evaluation . . . . . . . . . . . . . . . 763.6.5 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 793.6.6 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 823.6.7 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

3.7 Evaluation diagnostique sur la base de donnees de Lund . . . . . . . . . . 833.7.1 Ensemble d’apprentissage et ensemble de test . . . . . . . . . . . . 843.7.2 Configuration et apprentissage des comites de reseaux de neurones

specifiques aux patients . . . . . . . . . . . . . . . . . . . . . . . . . 853.7.3 Comparaison des interpretations automatiques des ECG synthetises

par rapport a la verite clinique . . . . . . . . . . . . . . . . . . . . 853.7.4 Discussion & Conclusion . . . . . . . . . . . . . . . . . . . . . . . . 87

3.8 Evaluation de la qualite de la synthese des ECG standards 12D a partirdes ECG 3D du PEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 883.8.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 883.8.2 Population d’etude . . . . . . . . . . . . . . . . . . . . . . . . . . . 893.8.3 Pretraitement des ECG . . . . . . . . . . . . . . . . . . . . . . . . 903.8.4 Configuration de la structure des reseaux de neurones . . . . . . . . 91

v

3.8.5 Processus d’apprentissage des reseaux de neurones generiques . . . 913.8.6 Processus d’apprentissage des reseaux de neurones specifiques . . . 933.8.7 Verification et validation de la synthese de l’ECG 12D . . . . . . . 933.8.8 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.9 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1053.10 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

4 Mise en place de la plateforme decisionnelle du PEM 1084.1 Objectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1084.2 Etat actuel de developpement du PEM a l’etape de prototype . . . . . . . 109

4.2.1 Le PEM : intelligence embarquee dans un environnement pervasifmulti-acteurs de telemedecine citoyenne . . . . . . . . . . . . . . . . 109

4.2.2 Architecture pervasive generique . . . . . . . . . . . . . . . . . . . . 1104.2.3 Generation et gestion d’alarmes . . . . . . . . . . . . . . . . . . . . 1114.2.4 Detection des arythmies et des ischemies . . . . . . . . . . . . . . . 1124.2.5 Reconstruction de l’ECG standard 12D a partir de l’ECG PEM 3D 113

4.3 Vers un produit final : strategies de deploiement du module de synthese del’ECG embarque dans le PEM . . . . . . . . . . . . . . . . . . . . . . . . . 1134.3.1 Le PEM, un dispositif autonome . . . . . . . . . . . . . . . . . . . 1144.3.2 Le PEM, un dispositif semi-autonome . . . . . . . . . . . . . . . . . 1144.3.3 Scenario d’utilisation du module de synthese d’ECG . . . . . . . . . 117

4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

IV Conclusion generale 120

Bibliographie 124

V Annexes 135

A Dossier Medical Personnel embarque dans le PEM 136A.1 Contenu du dossier de sante du patient . . . . . . . . . . . . . . . . . . . . 136A.2 Donnees demographiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136A.3 Resultats d’analyses biologiques . . . . . . . . . . . . . . . . . . . . . . . . 137A.4 Elements du dossier cardiologique . . . . . . . . . . . . . . . . . . . . . . . 137

A.4.1 Donnees cliniques . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137A.4.2 Interpretation de l’ECG au repos . . . . . . . . . . . . . . . . . . . 137A.4.3 Resultats des tests de l’ECG d’effort . . . . . . . . . . . . . . . . . 138A.4.4 Diagnostic cardiologique . . . . . . . . . . . . . . . . . . . . . . . . 138A.4.5 Procedures et traitements . . . . . . . . . . . . . . . . . . . . . . . 139

A.5 Facteurs de risque cardiovasculaire . . . . . . . . . . . . . . . . . . . . . . 139A.5.1 Classe de Sante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139A.5.2 Facteurs de risque majeurs . . . . . . . . . . . . . . . . . . . . . . . 139A.5.3 Autres facteurs de risque . . . . . . . . . . . . . . . . . . . . . . . . 140

vi

B La base de donnees INDANA 141

C Architecture des reseaux de neurones utilises pour la synthese de l’ECG143

D SCPECG Processor 149

E EPI-MEDICS : modeles de donnees globaux du PEM 152

F Publications 155

Resume 158

Liste des tableaux

2.1 Exemple de validation croisee pour N=5. L’ensemble des donnees d’appren-tissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. L’apprentissageest ensuite effectue sur les N − 1 sous-ensembles s2 a S5 et l’erreur est cal-culee sur le sous-ensemble restant s1, servant de validation. Cette operationest reiteree quatre fois en choisissant chaque fois un ensemble de validationdifferent. Enfin, un taux d’erreur moyen est calcule et l’apprentissage estrefait en utilisant la totalite de l’ensemble de donnees. . . . . . . . . . . . . 33

2.2 Matrice de confusion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402.3 Resultats de l’interpretation en 4 categories (D1, D2, D3, D4) des ECG

d’urgence de l’ensemble de test, effectuee par les deux experts, en fonctionde la verite clinique (199 cas d’infarctus (AMI) et 789 cas de controle). Cetableau illustre les resultats de l’interpretation unaire effectuee sur les ECGd’urgence sans avoir eu connaissance des ECG de reference des patients. . . 42

2.4 Meme resultats que dans le tableau 2.3, obtenus en prenant en compte uneinformation supplementaire : l’ECG de reference de chaque patient (analyseserielle) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

2.5 Scores de risque en pourcentage de la survenue d’une maladie coronaire enfonction de l’age, du sexe et des caracteristiques de la douleur de thoracique.D’apres Diamond et Forrester, N Engl J Med 1979. . . . . . . . . . . . . . 51

2.6 Illustration du deroulement de l’algorithme de triangulation. Les clustersretenus pour l’arbre de jonction sont marques par une etoile (*). . . . . . . 57

2.7 Variables retenues pour realiser les modeles de stratification : reseau bayesien,comite de reseau de neurones et analyse discriminante. . . . . . . . . . . . 61

3.1 Correlations moyennes (en pourcentage) entre les derivations d’origine etles derivations synthetisees au moyen d’un modele de regression generiqueen fonction du sous-ensemble de derivations ECG 12D utilisees commeentrees pour la synthese. Resultats extraits de [119] portant sur un ensembled’apprentissage de 72 ECG 12D sans ensemble de test independant. . . . . 71

3.2 Erreur quadratique moyenne (RMS) en µV entre les derivations DI, DII,V1, V2, V3, V4, V5 et V6 des ECG de reference et ECG d’urgence des sousensembles DS1, DS2 et DS3, apres exclusion des 5 valeurs les plus extremes. 79

3.3 Erreur quadratique moyenne (RMS) en µV et coefficients de correlation(r) entre les derivations V1,V3. . . V6 originales et celles synthetisees parles comites de reseaux de neurones specifiques (ANN-S) et les modeles deregression specifiques (REG-S) sur les ECG des sous-ensembles DS1, DS2et DS3, apres elimination des 5 valeurs les plus extremes. . . . . . . . . . . 81

viii

3.4 Comparaison par les tests statistiques (t-tests : pairwised et trimmed) dela difference en termes d’erreur RMS obtenue par les comites de reseauxde neurones et les modeles de regression specifiques. . . . . . . . . . . . . . 81

3.5 Concordance entre les interpretations des ECG originaux et les interpretationsdes ECG synthetises par reseaux de neurones (ANN-S) et par regression(REG-S). Le logiciel de diagnostic classe les ECG suivant 4 categories derisque : pas de risque, risque mineur, moyen et majeur. . . . . . . . . . . . 87

3.6 Description de la base de donnees CHDB. . . . . . . . . . . . . . . . . . . 893.7 Erreur quadratique moyenne (RMS) en µV et coefficients de correlation

entre les derivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et dudeuxieme ECG Cardiette du sous ensemble SE2, apres elimination des 5%des cas les plus extremes (N=35). . . . . . . . . . . . . . . . . . . . . . . . 96

3.8 Erreur quadratique moyenne (RMS) en µV et coefficients de correlationentre les derivations DI, DII et V2 du premier ECG Cardiette et du deuxiemeECG PEM du sous ensemble SE2 (N=35). . . . . . . . . . . . . . . . . . . 96

3.9 Erreur quadratique moyenne (RMS) en µV et coefficients de correlationentre les derivations DI, DII et V2 du deuxieme ECG Cardiette et de l’ECGPEM associe du sous ensemble SE2 (N=35). . . . . . . . . . . . . . . . . . 97

3.10 Erreur quadratique moyenne (RMS) en µV et coefficients de correlationentre les derivations V1,V3. . . V6 originales et celles synthetisees par le co-mite de reseaux de neurones generique (ANN-G) et le modele de regressiongenerique (REG-G) sur les ECG 2 du sous-ensemble SE2 (N=35). . . . . . 98

3.11 Erreur quadratique moyenne (RMS) en µV et coefficients de correlationentre les derivations V1,V3. . . V6 originales et celles synthetisees par lescomites de reseaux de neurones specifiques (ANN-S) et les modeles deregression specifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). 98

3.12 Comparaison par les t-tests (pairwised et trimmed) de la difference entermes d’erreurs RMS obtenues par les comites de reseaux de neuroneset les modeles de regression generiques et specifiques (N=35). . . . . . . . . 99

3.13 Erreur quadratique moyenne (RMS) en µV et coefficients de correlation

entre les derivations V1,V3. . . V6 originales des 2eme ECG 12D de SE2 etcelles synthetisees a partir des ECG PEM chronologiquement homologuespar le comite de reseaux de neurones generique (ANN-G) et le modele deregression generique (REG-G) (N=35). . . . . . . . . . . . . . . . . . . . . 100

3.14 Erreur quadratique moyenne (RMS) en µV et coefficients de correlationentre les derivations V1,V3. . . V6 originales et celles synthetisees par lescomites de reseaux de neurones specifiques (ANN-S) et les modeles deregression specifiques (REG-S) sur les ECG du sous-ensemble SE2 (N=35). 100

3.15 Comparaison par les tests statistiques t-tests (pairwised et trimmed) de ladifference en termes d’erreurs RMS obtenues par les comites de reseaux deneurones et les modeles de regression generiques et specifiques lorsque lesentrees sont des ECG PEM (N=35). . . . . . . . . . . . . . . . . . . . . . 101

ix

3.16 Concordance entre les interpretations des ECG originaux et celles de ECGsynthetises a partir des derivations DI, DII et V2 de l’ECG 12D Cardiette 2par le comite de reseaux de neurones generiques (ANN-G) et par le modelede regression generique (REG-G). Le logiciel de diagnostic classe les ECGsuivant 4 categories de risque : pas de risque, risque mineur, moyen et majeur.103

3.17 Meme resultats que dans le tableau 3.16, mais pour les comites de reseauxde neurones specifiques (ANN-S) et les modeles de regression specifiques(REG-S). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103

3.18 Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruitsa partir des derivations DI, DII et V2 de l’ECG PEM 2. . . . . . . . . . . 104

3.19 Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruitsa partir des derivations DI, DII et V2 de l’ECG PEM 2. . . . . . . . . . . 105

B.1 Tableau descriptif des variables et labels de la base de donnees INDANA . 142

Table des figures

1.1 ECG standard 12D : positionnement des electrodes, ondes et intervalles.D’apres the ECG learning center. ”http ://medlib.med.utah.edu/kw/ecg” . 10

1.2 Evolution de l’ECG au cours d’un infarctus. . . . . . . . . . . . . . . . . . 111.3 Le centre d’interet de l’informatique medicale traditionnelle est en train

d’evoluer des professionnels de sante vers les consommateurs (citoyen/patient).D’apres Gunther Eysenbach, Consumer health informatics, BMJ 2000. . . . 16

1.4 Le projet EPI-MEDICS permet, grace a un systeme personnel d’enregistre-ment de l’ECG, lorsqu’un probleme est detecte dans l’ECG d’un patient, etselon le niveau de gravite evalue, de prevenir le medecin du patient et/ou leservice d’urgence. Les donnees medicales sont alors disponibles sur le Webet grace a un acces securise, les professionnels de sante peuvent prendre encharge le patient et orienter correctement ses soins. . . . . . . . . . . . . . 18

1.5 Illustration d’un des 70 prototypes PEM (Personal ECG Monitor) developpesdans le cadre du projet EPI-MEDICS pour permettre la detection precocedes syndromes cardiaques dans un contexte de telemedecine citoyenne. . . 19

2.1 Fonctionnement des neurones : chaque neurone m additionne les valeurs deses entrees (n1, n2, n3) multipliees par des poids (W1, W2, W3), passe leresultat dans une fonction d’activation, et le renvoie aux neurones qui lesuivent. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

2.2 Exemples de fonctions d’activation. . . . . . . . . . . . . . . . . . . . . . . 302.3 Illustration d’un reseau de neurones de type perceptron multi-couches. . . . 312.4 Illustration du fonctionnement du comite de reseaux de neurones unaires/seriels

utilise pour l’interpretation de l’ECG. . . . . . . . . . . . . . . . . . . . . . 392.5 Comparaison du pouvoir discriminant de deux methodes de classement.

Selon ces deux traces de courbes ROC, la methode A est meilleure que lamethode B. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

2.6 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comiteobtenu en analyse unaire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

2.7 Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comiteobtenu en analyse serielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

2.8 Comparaison des courbes ROC des differentes methodes en analyse unaireet serielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2.9 Schema synoptique du processus decisonnel embarque dans le PEM : a)sa version actuelle ; b) une future version que nous proposons avec l’in-troduction d’un deuxieme score de risque base sur le dossier medical dupatient. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

xi

2.10 Illustration d’algorithmes de stratification du risque cardiovasculaire developpesdans le cadre d’EPI-MEDICS. . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.11 Reseau bayesien simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532.12 Reseau bayesien ”bug an 2000”. . . . . . . . . . . . . . . . . . . . . . . . . 552.13 Meme graphe que Figure 2.12 apres moralisation. . . . . . . . . . . . . . . 552.14 Meme graphe que Figure 2.12 apres triangulation. . . . . . . . . . . . . . . 562.15 L’arbre de jonction obtenu a partir du reseau bayesien avec les clusters

retenus du processus de triangulation (ovales) et les separateurs induits(carres). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

2.16 Reseau bayesien utilise pour estimer le risque cardiovasculaire. . . . . . . . 632.17 Illustration de la structure individuelle des reseaux de neurones utilises

pour estimer le risque cardiovasculaire. . . . . . . . . . . . . . . . . . . . . 642.18 Proposition d’un modele decisionnel global incorporant des modules bayesien

et neuronal qui collaborent par l’intermediaire d’un systeme de regles delogique floue. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3.1 Positionnement des electrodes dans l’ECG PEM 3D Vs. l’ECG standard12D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3.2 Differents types de modeles de synthese de l’ECG 12D a partir d’un sous-ensemble de derivations 3D : (a) cinq reseaux individuels avec 3 entrees et1 sortie ; (b) reseau global avec 3 entrees, 5 sorties. . . . . . . . . . . . . . 76

3.3 Illustration de la structure individuelle des reseaux de neurones utilisespour la synthese de l’ECG 12D : une couche d’entree de 3 neurones (DI,DII, V2), une couche de sortie de 5 neurones (V1, V3, V4, V5, V6), et hcouches cachees de n neurones. . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.4 Programme d’interpretation automatique de l’ECG suivant 4 niveaux derisque. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

3.5 Courbes ROC resultant de la comparaison entre la classification des ECGderives par reseaux de neurones et par regression, par rapport a la veriteclinique des ECG originaux correspondants. . . . . . . . . . . . . . . . . . 86

3.6 Illustration de l’alignement des signaux ECG par correlation croisee. . . . . 923.7 Illustration de l’apprentissage et de la validation des comites de reseaux de

neurones generiques et specifiques. . . . . . . . . . . . . . . . . . . . . . . . 943.8 Visualisation des intervalles de temps utilises pour l’apprentissage des co-

mites de reseaux de neurones generiques et specifiques (PT : P-Onset -18a T-offset +38 msec) et pour tester leur capacite de generalisation (QT :Q-onset -18 a T-offset +38 msec). En cas d’absence de l’onde P, on rem-place le pointeur P-onset par un pointeur virtuel tel que l’intervalle PQcorrespondant a l’intervalle PQ moyen. . . . . . . . . . . . . . . . . . . . . 95

3.9 Incidence de la methode de synthese de l’ECG sur la calcul des parametresECG de type syntaxique. A gauche sur l’ECG d’origine, le trace presenteune petite onde R et une grande onde S. A droite, sur l’ECG de synthese,aspect typique dit QS. L’onde R, microvoltee, n’a pas ete detectee et parconsequent la duree de l’onde Q est passee de 0 a 92 msec et celle de l’ondeS de 70 msec a 0. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

xii

3.10 Illustration de la qualite de synthese de l’ECG standard 12D a partir del’ECG PEM 3D. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

4.1 Le PEM (Personal ECG monitor) au service de la prevention et la detectionprecoce de la survenue d’evenements cardiovasculaires. . . . . . . . . . . . 109

4.2 Un exemple d’architecture d’EPI-MEDICS : un serveur web assure la ges-tion intelligente des echanges de messages, et des applications clientes dis-tribuees servant a envoyer et a recevoir les demandes XML de tele-expertisevia HTTPS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

4.3 Scenario d’alarme majeure. . . . . . . . . . . . . . . . . . . . . . . . . . . . 1114.4 Scenario d’alarme moyenne. . . . . . . . . . . . . . . . . . . . . . . . . . . 1124.5 Grille pervasive au service de la telemedecine. Inspire de David De Roure,

Mobile Medical Monitoring, National e-Science Centre Talk. . . . . . . . . 1164.6 Scenario d’utilisation du module de synthese d’ECG. Le cardiologue ac-

quiert un ECG standard 12D du patient, accede via Internet au serveurd’application qui, a l’aide d’un service web, reserve les ressources necessaires,calcule et met a jour les dispositifs de synthese d’ECG par reseaux de neu-rones dans le PEM. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

D.1 Ecran de configuration du logiciel SCP-ECG processor. . . . . . . . . . . . 151

Premiere partie

Introduction

1

Introduction

Contexte

Les maladies cardiovasculaires representent de nos jours la principale cause de morta-lite en France et en Europe [1]. Or, la majorite des deces d’origine cardiaque surviennentdans la phase pre-hospitaliere [2, 3, 4, 5]. Une detection precoce des differents cardiopa-thies permettrait d’assurer une prise en charge adequate, d’ameliorer la qualite de vie despatients et de reduire le cout pour la societe. Il s’agit la de l’objectif ultime du projet eu-ropeen EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection &Interpretation of Cardiovascular Syndromes) [6]. Ce projet, qui s’inscrit dans le droit filde ce que l’on appelle aujourd’hui la telemedecine citoyenne, propose la creation d’unsysteme intelligent portable et utilisable par tous, le PEM (Personal ECG Monitor),pour detecter les arythmies et diagnostiquer les infarctus des l’apparition des premierssymptomes [7]. Moyennant l’acquisition d’un electrocardiogramme (ECG) par l’utilisa-teur (citoyen/patient), le PEM a pour vocation de stratifier le risque de la survenue d’unevenement cardiovasculaire (arythmie, ischemie), de generer differents niveaux d’alarmeset de transmettre les donnees stockees dans le PEM aux professionnels de sante ou auxstructures d’urgence concernes.

Pour atteindre ces objectifs, il est necessaire de resoudre une variete de problemes liesaux cycles de fonctionnement du systeme : de l’acquisition et l’enregistrement de l’ECGa l’interpretation des donnees recueillies, jusqu’a l’emission et la gestion des alarmes.Cela impose de concevoir des solutions innovantes a ces problemes tres particuliers liesa la telemedecine citoyenne et de developper une plateforme logicielle pervasive basee engrande partie sur des composants embarques dans le PEM.

Parmi les differentes problematiques a resoudre, la plus importante et sans doute laplus difficile est de rendre le systeme de decision auto adaptatif en fonction de la specificitedu patient et auto-ameliorant en fonction des eventuelles fausses alarmes ou detectionsmanquees. Les methodes a mettre en œuvre relevent des domaines de l’intelligence arti-ficielle et de l’aide a la decision (fusion des donnees, logique floue, approche neuronale,etc.).

Partant d’une premiere solution consistant a interpreter les ECG standards a 12

3

derivations (ECG 12D) au moyen de comites de reseaux de neurones, nous chercherons aameliorer l’intelligence du systeme en stratifiant le risque de survenue d’un evenement car-diovasculaire en combinant l’interpretation de l’ECG avec l’historique clinique du patient.Il s’agit en l’occurrence d’un probleme d’aide au diagnostic consistant a mettre en œuvredes algorithmes (reseaux de neurones, reseaux bayesiens. . . ) resolvant un probleme de clas-sement tenant compte de l’incertitude sur la situation reelle de l’objet etudie. Considerantqu’il n’existe pas d’ultime methode, nous essayerons de tirer profit des points forts dechacune des methodes d’aide a la decision existantes en proposant un modele hybride,multi-experts, multi-modules forme d’une combinaison de classifieurs et de methodes declassement pour interpreter l’ECG du patient, tout en tenant compte des facteurs derisque (antecedents cardiaques, cholesterol, tabagisme. . . ) propres a l’utilisateur concerneafin de declencher l’alarme la plus appropriee.

Une deuxieme problematique est de permettre l’enregistrement de l’ECG par l’uti-lisateur avec le minimum d’assistance professionnelle, et de rendre cet ECG accessible,sous un format comprehensible et interpretable, aux professionnels de sante (cardiologue,medecin traitant). Il est donc imperatif de proposer l’utilisation d’un systeme d’enregis-trement simplifie permettant de recueillir l’essentiel de l’information spatio-temporellecontenue dans l’ECG 12-D avec un nombre minimum d’electrodes faciles a placer par lepatient lui-meme. La solution proposee par le projet EPI-MEDICS est d’enregistrer unECG PEM simplifie consistant en 3 derivations pseudo-orthogonales (DI, DII, V2) for-mant un sous-ensemble de l’ECG standard a 12 derivations, ramenant ainsi le nombred’electrodes actives necessaires a l’enregistrement de l’ECG PEM de 9 a 4. Encore faut-il, pour une bonne acceptabilite de l’approche EPI-MEDICS par les professionnels desante, proposer des moyens permettant de transformer l’ECG PEM en ECG 12-D, seuleforme d’electrocardiogramme que les cardiologues ont l’habitude d’interpreter avec unetres grande precision. Les methodes habituellement utilisees pour synthetiser un ECGstandard 12-D a partir d’un nombre reduit d’electrodes reposent sur des techniques deregression lineaire multiple. Nous proposons dans ce memoire une methode de recons-truction non-lineaire originale basee sur l’utilisation de reseaux de neurones que nousvaliderons sur plusieurs bases de donnees ECG serielles que nous avons selectionne pouretre le plus representatives possible du type de populations d’etudes concernees par uneutilisation future du PEM. Notre validation sera realisee tant en termes de contenu infor-mationnel vis a vis de la capacite de detecter un infarctus qu’en termes de qualite de lareconstruction des differents echantillons des signaux manquants.

Enfin, nous terminons ce memoire en proposant une architecture de deploiement dela plateforme decisionnelle du PEM dans le contexte des systemes d’information et decommunication pervasifs integrant des serveurs web applicatifs et des grilles de calcul.

Le chapitre 1 est consacre a la presentation du contexte medical de nos recherches : lesmaladies cardiovasculaires, et en particulier l’evocation des causes, des effets et consequencesde l’infarctus du myocarde. De meme, nous faisons le point sur les differents moyens deprevention (facteurs de risque) et de diagnostic (ECG) de l’infarctus du myocarde. En-suite, nous presentons le contexte applicatif de la these, a savoir la telemedecine citoyenne

4

et le projet europeen EPI-MEDICS, tout en mettant l’accent sur le produit phare du pro-jet : le PEM. Enfin, nous abordons la discipline d’aide a la decision en medecine et lesprincipales techniques d’intelligence artificielle utilisees en informatique medicale pourdiagnostiquer une pathologie a partir d’indicateurs preleves sur le patient (ECG. . . ).

Le chapitre 2 presente la plateforme d’aide a la decision que nous avons developpeepour diagnostiquer l’infarctus du myocarde. La realisation de cette plateforme est baseesur une approche multi-modules, multi-experts utilisant des methodes de classement dudomaine de l’intelligence artificielle. Elle permet d’etablir une probabilite de la survenuede l’evenement cardiovasculaire a partir de :

– L’interpretation de l’ECG PEM : Cette interpretation est effectuee a l’aide de co-mites de reseaux de neurones artificiels sur les ECG enregistres par l’utilisateurlui-meme.

– La stratification des facteurs de risque : il s’agit d’estimer le taux de risque de la sur-venue d’un evenement cardiovasculaire en s’appuyant sur les facteurs de risque, lesdonnees cliniques, etc. prealablement stockes dans le dossier medical de l’utilisateurdu PEM. Nous proposons une solution a base de reseaux bayesiens.

– Enfin, pour combiner l’interpretation de l’ECG avec le resultat de la stratificationdes facteurs de risque, nous proposons un modele decisionnel global incorporant lesmodules bayesien et neuronal qui collaborent par l’intermediaire d’un systeme deregles de logique floue.

Le chapitre 3 est devolu a la presentation de solutions permettant la reconstruction del’ECG standard 12D a partir de l’ECG PEM 3D enregistre par l’utilisateur du PEM. L’ob-jectif est de permettre non seulement une detection precise de l’ischemie, mais egalementune reproduction la plus fidele possible des caracteristiques enregistrees par l’ECG 12Dstandard si ce dernier etait enregistre simultanement avec l’ECG 3D du PEM. Nous propo-sons deux approches : l’une generique visant a construire un module de synthese applicablea tout patient, l’autre specifique a chaque patient, et des solutions a base de comites dereseaux de neurones artificiels que nous comparerons a des solutions plus traditionnellesbasees sur la synthese au moyen de matrices de transformations lineaires obtenues parregression lineaire multiple.

Enfin, le chapitre 4 est consacre a la presentation des aspects lies au deploiement eta la ”maintenance” des modules d’aide a la decision du PEM, en particulier le moduleneuronal d’interpretation de l’ECG PEM, et le module de gestion et d’envoi d’alarmes,ainsi que les strategies de deploiement du module de reconstruction de l’ECG par comitesde reseaux de neurones.

Deuxieme partie

Aide a la decision en medecine, leprojet europeen EPI-MEDICS

5

Chapitre 1

Maladies cardiovasculaires,telemedecine et aide a la decision

1.1 Contexte medical

Les maladies cardiovasculaires, notamment l’infarctus du myocarde1, comptent parmiles principales causes de maladie, d’invalidite et de deces en Europe et aux Etats-Uniset avec le vieillissement des populations, le nombre de deces d’origine cardiaque ira sansdoute en croissant. Or, la majorite des deces d’origine cardiaque surviennent dans la phasepre-hospitaliere [2, 3, 4, 5].

Une detection precoce des premiers symptomes d’une cardiopathie permettrait tresprobablement d’assurer une meilleure prise en charge et en consequence adequate, d’ameliorerla qualite de vie des patients et de reduire le cout pour la societe.

Plusieurs etudes epidemiologiques ont en effet montre l’impact potentiel en termesde mortalite et de morbidite cardiaque d’une diminution de la duree entre l’apparitiondes symptomes et la prise en charge effective des patients [2]. ”Quand” importe plusque ”ou” [3]. Il faudrait en pratique arriver a reduire le temps separant l’apparition dessymptomes et le debut des traitements a moins de deux heures contre quatre en moyenneactuellement. Or comme on va le voir ci-apres, le probleme n’est pas simple. Meme lesmeilleurs experts se trompent parfois. Et l’ischemie cardiaque peut etre instable : presenteau domicile du patient, elle peut avoir disparu a l’arrivee au service des urgences, pourreapparaıtre quelques heures apres quand le patient est revenu a domicile. D’ou l’interetdes solutions de telemedecine citoyenne telles que celles proposees par EPI-MEDICS quenous evoquons dans la derniere partie de ce chapitre.

1L’infarctus du myocarde est la consequence d’une occlusion coronaire brutale. Cela declenche uneischemie myocardique regionale severe qui, si elle se perennise, engendre des lesions cellulaires irreversibles.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 7

1.1.1 Le diagnostic

Le diagnostic de l’infarctus du myocarde s’appuie sur la mise en evidence de consequencescliniques et biologiques [8, 9, 10, 11, 12].

Le diagnostic clinique

Le symptome classique de l’infarctus du myocarde dans sa forme typique est la dou-leur thoracique. Cette douleur dure au moins 20 minutes, elle est violente, parfois insup-portable. Elle irradie souvent aux membres superieurs vers le bord cubital, la machoireinferieure. Elle peut egalement irradier vers l’epigastre, mais jamais en dessous de l’om-bilic.

L’infarctus du myocarde debute presque toujours sans cause declenchante evidente,avec un horaire d’apparition predominant dans les heures de la matinee, mais pouvants’etaler sur l’ensemble des 24 heures. Il peut apparaıtre au cours d’un effort physique, parexemple sportif ; dans ce cas l’arret de l’effort ne permet pas de le faire ceder. La douleurpeut etre absente, la symptomatologie peut alors se limiter a des signes digestifs (nausees,vomissement, gene epigastrique, etc.).

Le diagnostic biologique

Les lesions cellulaires causees par l’infarctus entraınent une perte d’etancheite mem-branaire, voire une lyse de la membrane cellulaire. Il en resulte une liberation de moleculesintra-cytoplasmiques. Des lors des enzymes myocardiques (la myoglobine, la myosine, etc.)seront retrouvees dans le sang peripherique, et peuvent y etre reperees via une analysebiologique.

1.2 L’electrocardiologie quantitative

Le diagnostic precoce de l’infarctus n’est pas chose facile. Les douleurs thoraciquespeuvent avoir d’autres causes que l’infarctus, et certains episodes ischemiques sont silen-cieux, notamment en cas de diabete. Le seul element d’aide a la decision objectif et facilea mettre en œuvre en situation pre-hospitaliere pour faire le diagnostic d’un evenementcardiaque et de sa severite (angine de poitrine, infarctus aigu, risque de deces, etc.) etpour guider les traitements est l’electrocardiogramme (ECG) [13].

L’ECG est une representation de l’activite electrique du coeur enregistree pardes electrodes placees sur la surface du corps. Les differents modes d’enregistrements

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 8

electrocardiographiques se distinguent par le nombre et la nature des derivations utiliseesainsi que par les eventuelles transformations lineaires qui leur sont appliquees. Les deuxtechniques d’investigations les plus repandues actuellement sont :

– l’ECG 12D (12 derivations)

– l’ECG 3D, ou le vectocardiogramme (VCG)

Nous ne traitons pas le VCG dans ce rapport, car son utilisation est tres peu repandue.

1.2.1 L’ECG standard 12D

L’ECG standard comporte 12 derivations (Figure 1.1) respectivement enregistreesdans le plan frontal et selon des directions paralleles au plan horizontal (derivationsprecordiales).

Les six derivations frontales sont habituellement identifiees comme suit :

– DI : mesure de la difference de potentiel (DDP) bipolaire entre le bras droit et lebras gauche.

– DII : mesure de la DDP bipolaire entre le bras droit et la jambe gauche.

– DIII : mesure de la DDP bipolaire entre le bras gauche et la jambe gauche.

– aVR : mesure du potentiel unipolaire augmente du bras droit.

– aVL : mesure du potentiel unipolaire augmente du bras gauche.

– aVF : mesure du potentiel unipolaire augmente de la jambe gauche.

DIII, aVR, aVL et aVF peuvent etre calcules a partir de DI et DII comme suit :

1. DIII = DII - DI

2. aVR = -0.5(DI+DII) = 32

VR

3. aVL = DI - 0.5DII = 32

VL

4. aVF = DII - 0.5DI = 32

VF

Les six derivations precordiales sont definies comme suit :

– V1 mesure le potentiel unipolaire de l’electrode V1 situee sur le 4eme espace inter-costal droit, a droite du sternum.

– V2 mesure le potentiel unipolaire de l’electrode V2 sur le 4eme espace intercostalgauche, au bord gauche du sternum.

– V3 est situee entre V2 et V4.

– V4 est situee sur le 5eme espace intercostal gauche, sur la ligne medioclaviculaire.

– V5 est situee sur le 5eme espace intercostal gauche, sur la ligne axillaire anterieure.

– V6 est situee sur le 5eme espace intercostal gauche, sur la ligne axillaire moyenne.

Les potentiels unipolaires V1-V6 et VR, VL, VF sont obtenus en mesurant la DDPentre chacune des electrodes concernees et la borne controle de Wilson qui est le potentielmoyen de VR, VL et VF.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 9

1.2.2 L’ECG : les differentes ondes et les intervalles de temps

L’ECG est le temoin direct de differentes phases cycliques (Figure 1.1), indiquant lesgrandes etapes de l’activation electrique du coeur :

– la depolarisation des oreillettes : onde P

– la depolarisation des ventricules : onde QRS

– la repolarisation des ventricules : onde T

Les intervalles de temps generalement consideres sont, outre la duree de QRS :

– la duree d’une depolarisation et repolarisation ventriculaire : intervalle QT

– la duree d’un cycle ventriculaire complet : intervalle RR

– la duree d’un cycle atrial complet : intervalle PP

1.2.3 L’ECG, outil de detection du dysfonctionnement car-diaque

De nos jours, L’ECG est considere comme un moyen fiable, non-invasif, de faiblecout, et surtout de detection precoce d’un nombre considerable d’anomalies cardiaques(infarctus, arythmie, etc. ) qui depasse de loin les techniques d’imagerie habituelles. Enplus, l’apport technologique a ouvert une nouvelle ere de l’exploration du champ electriquecardiaque baptisee l’electrocardiologie quantitative, ou numerique.

L’infarctus du myocarde vu de l’ECG

L’infarctus du myocarde commence par une reduction, voir une rupture, brutale del’approvisionnement sanguin d’une region du coeur. Ensuite une serie d’evenements estdeclenchee en commencant par une ischemie sous-endocardique2 ou transmurale, suivie dela necrose3, et la fibrose si l’approvisionnement sanguin ne retourne pas a la normale dansun delai approprie. Les variations de l’ECG refletant cet ordre suivent habituellementun modele bien connu selon la localisation et la gravite de l’infarctus. En general, plusle nombre de derivations detectant un infarctus est grand, plus grave est le pronostic.L’evolution classique d’un infarctus du myocarde vu a travers l’ECG comporte les etapessuivantes (en supposant que l’ECG precedant l’infarctus etait normal, Figure 1.2A) :

– augmentation de l’amplitude et de la largeur de l’onde T ; dans certains cas, appa-rition d’un sus-decalage du segment ST (Figure 1.2B)

– sus-decalage du segment ST (ST-elevation) accompagne d’une certaine variation del’onde T (Figure 1.2C)

2L’ischemie sous-endocardique se traduit, sur l’electrocardiogramme, par une onde T exagerementpositive

3Degenerescence des cellules et des tissus attribuable a un defaut de vascularisation qui empeche uneirrigation sanguine normale

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 10

Fig. 1.1 – ECG standard 12D : positionnement des electrodes, ondes et intervalles. D’apresthe ECG learning center. ”http ://medlib.med.utah.edu/kw/ecg”

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 11

– apparition d’une onde Q, diminution du sus-decalage du segment ST, ainsi qu’uneinversion de l’onde T, ce qui correspond a une necrose (Figure 1.2D)

– onde Q et inversion de l’onde T, ce qui correspond a la fois a une necrose et unefibrose (Figure 1.2E)

– onde Q et normalisation de l’onde T (fibrose) (Figure 1.2F)

Fig. 1.2 – Evolution de l’ECG au cours d’un infarctus.

Les Criteres ESC de diagnostic de l’infarctus

En aout 2000, la Societe Europeenne de Cardiologie (ESC) a publie un documentconsensuel repertoriant les criteres a utiliser pour faire un diagnostic de l’infarctus aigue dumyocarde [14]. La liste des changements observes sur l’ECG indiquant une ischemie myo-cardique susceptible d’evoluer en infarctus de myocarde est etablie comme suit :

– Patients avec sus-decalage du segment ST ≥ 0.2 µV dans au moins 2 derivationscontigues des derivations V1, V2, et V3, ou ≥ 0.1 µV dans les autres derivations.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 12

– Patients sans sus-decalage du segment ST mais avec une depression du segment STou/et des anomalies de l’onde T dans au moins 2 derivations contigues, en plus d’uneinversion symetrique de l’onde T presente dans au moins 2 derivations contigues.

L’affinement regulier des criteres de diagnostic de l’infarctus et la decouverte et lamise au point de nouveaux marqueurs biologiques, electriques. . . permet a chaque foisun meilleur depistage des patients a risque d’infarctus. Neanmoins, le probleme n’estpas completement resolu : le nombre de faux negatifs (detections manquees) est encoresignificatif.

En effet, dans une etude publiee en 1993, McCarthy et al [15] ont montre qu’au moins25% des patients qui avaient un infarctus du myocarde ont ete renvoyes de l’hopital sanstraitement a cause d’une sous-estimation du sus-decalage du segment ST. De meme, 80%des patients admis dans des unites de soins coronariens consecutivement a des indicationssuggerant un infarctus du myocarde sont renvoyes sans pouvoir confirmer un diagnosticd’infarctus [16, 17]

Plus recemment, en 2000, Pope et al. [18] ont etudie l’incidence des facteurs lies au sexe,race, absence des caracteristiques habituelles des ischemies cardiaques. . . sur l’incapacitede detecter une ischemie cardiaque chez des patients admis a l’hopital pour suspiciond’ischemie. Sur la population d’etude de plus de 10000 patients (889 patients avec uninfarctus aigu et 966 patients avec une angine de poitrine instable), 2.1 % des patientsavec un infarctus et 2.3 % avec une angine instable n’ont pas ete detectes. En plus, lespatients qui avaient une ischemie cardiaque mais qui etaient :

– de sexe feminin de moins de 55 ans (odds ratio4 de 6.7),

– non-blancs (odds ratio de 2.2),

– se plaignant d’un souffle court (odds ratio de 2.7),

– ou ayant un ECG normal (odds ratio de 3.3),

etaient moins susceptibles d’etre detectes et par la suite hospitalises. De meme, selon cetteetude, les patients avec un infarctus aigu qui etaient :

– non-blancs (odds ratio de 4.5),

– ou ayant un ECG normal (odds ratio de 7.7),

etaient moins susceptibles d’etre hospitalises. De plus, seulement 410 des 1445 patientsayant une ischemie myocardique presentaient sur leur ECG recueilli lors de leur admissionau service des urgences, les criteres ECG standards de presence d’une ischemie. Enfin, lesetudes qui ont suivi [19], [20], . . . ont confirme ces constatations et reaffirme l’interetmajeur de continuer a affiner les criteres de diagnostic de l’infarctus. D’ou l’interet dutravail presente dans ce memoire qui vise a mettre au point un procede intelligent desurveillance medicale a la portee du grand public permettant de detecter les patientsa risque des la survenue d’un evenement cardiaque, n’importe ou, n’importe quand, a

4un odds ratio est le rapport entre la probabilite de contracter la maladie en presence de certainsfacteurs ou caracteristiques et la probabilite de la contracter dans le cas contraire. Un odds ratio de 4signifie qu’une personne ayant la caracteristique a l’etude est quatre fois plus susceptible d’etre affecteeque quelqu’un qui ne les presente pas, tandis qu’un odds ratio de 0,5 signifie qu’elle l’est moitie moins.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 13

domicile, au travail, ou en ambulatoire, en combinant analyse automatique d’un ECGsimplifie et prise en compte du contexte clinique du patient.

L’analyse et l’interpretation automatique des ECG

L’avenement de l’ECG numerique et le developpement de l’informatique ont rendupossible l’analyse et l’interpretation automatique des ECG.

Les premiers travaux remontent au debut des annees 60. Mais l’ECG n’est devenuveritablement numerique qu’avec l’apparition des microprocesseurs au milieu et a la findes annees 70. Aujourd’hui au moins 90% des electrocardiographes vendus aux EtatsUnis ou en Europe incluent un module d’analyse et d’interpretation automatique desECG. Il s’agit, a notre connaissance, d’une des rares applications medicales pour laquelleles systemes experts sont sortis des laboratoires de recherche et sont utilises en routineclinique dans des environnements differents de leur lieu d’origine. Ceci n’a ete rendupossible que grace a une action de recherche internationale concertee qui a dure plus de15 ans et a permis de constituer differentes bases de donnees permettant de valider lesalgorithmes d’analyse et d’interpretation automatique de l’ECG, l’action ”CSE CommonStandards for quantitative Electrocardiography” [21].

Typiquement, un outil informatique d’analyse automatique de l’ECG consiste en unensemble de modules permettant l’acquisition du signal, l’analyse et l’interpretation durythme, la detection d’un complexe QRS type, la reconnaissance des differentes ondes,l’extraction d’un ensemble de parametres destines a caracteriser le signal et son affectationa une ou plusieurs classes de diagnostic, c’est a dire realisant les differentes etapes de ceque l’on appelle plus communement une reconnaissance de formes.

L’approche traditionnelle est principalement basee sur des descripteurs morpholo-giques et temporels du signal familiers aux cliniciens tels que la presence ou l’absenced’une onde Q, le rapport de R/S. . . La deuxieme approche extrait des descripteurs quan-titatifs au moyen d’outils mathematiques tels que la transformee de Fourier, l’analyseen ondelettes, etc. Ces descripteurs sont par la suite utilises par des methodes issues del’intelligence artificielle (analyse discriminante, reseaux de neurones, logique floue, ou dessystemes a base de regles) pour realiser une interpretation automatique de l’ECG [22].

Plusieurs dizaines de systemes d’analyse automatique de l’ECG ont ete developpes[23], mais tres peu ont ete experimentes en milieu hospitalier, dont notamment le systemed’analyse et d’interpretation automatique des ECG/VCG connu sous le nom de ”Systemede Lyon”. Ce systeme permet l’enregistrement d’ECG 12D ou de VCG, la determinationdu complexe QRS type a l’aide d’un algorithme de classification non hierarchique, etrealise l’interpretation automatique du contour grace a une approche de type heuristiquemettant en œuvre des logiques ternaires (algebre de Post) [24]. Plus recemment, d’autressystemes bases sur des methodes issues de l’intelligence artificielle (logique floue, systemes

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 14

experts, reseaux de neurones, etc.) ont ete developpes et commencent a etre implantes enmilieu hospitalier, en ambulatoire ou a domicile [7].

Analyse unaire vs analyse serielle La plupart des programmes d’interpretation au-tomatique de l’ECG evoques ci-dessus realisent ce que l’on appelle une analyse unaire,c’est a dire qu’ils analysent un seul ECG par patient sans tenir compte des autres ECGeventuels du patient. Cependant, malgre l’interet suscite par l’analyse unaire de l’ECGau cours des dernieres decennies et la multitude de methodes qui ont deja vu le jour, laperformance des programmes automatises bases sur l’analyse unaire est encore limitee.La precision diagnostique globale ne depasse guere le chiffre de 80 % [25]. Le constat doitetre tempere par le fait que la precision diagnostique des meilleurs cardiologues lorsqu’ilsont a leur disposition un seul ECG est elle meme limitee a environ 82-83%.

Ceci est imputable au fait que l’approche unaire ne prend pas suffisamment en comptela specificite du patient. La tendance au cours de ces dernieres annees fut donc dedevelopper des systemes d’analyse dite ”serielle” [22, 26, 27, 28, 29] ou le patient estconsidere comme sa propre reference. L’interpretation de l’ECG concerne est alors etablieen termes d’evolution par rapport aux enregistrements precedents. Cette tendance vautaussi pour l’interpretation humaine. Dans un recent document consensuel de l’ACC/AHA(American College of Cardiology/American Heart Association) [13], les cardiologues sonteux aussi incites a ameliorer leur interpretation de l’ECG en le comparant par rapport aun ECG de reference. En d’autres termes, il faut tenir compte de l’evolution serielle desECG.

1.3 La telemedecine citoyenne : le projet EPI-

MEDICS

1.3.1 Introduction

L’evolution technologique dans le secteur des communications est en voie derevolutionner les relations entre les individus et les collectivites. De facon plus specifique,l’avenement des nouvelles technologies de l’information et des telecommunications (NTIC)permet d’envisager de nouvelles facons d’exercer la medecine, et d’offrir des servicesmedicaux specialises ou ultraspecialises dans des environnements (a domicile, en ambula-toire, etc.) qui, jusqu’a maintenant, n’ont pu en beneficier. Il s’agit de la telemedecineou medecine dite a distance. La telemedecine se definit comme etant l’union destelecommunications et de la medecine [30, 31]. Elle consiste a utiliser les nouvelles tech-nologies de l’information pour [32] :

– effectuer des consultations a distance : teleconsultation (par exemple, transmissiond’ECG a un autre etablissement pour avis sans necessairement transferer le patient)

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 15

[33],

– interpreter des donnees medicales a distance : teleexpertise (par exemple, interroga-tion d’un specialiste en lui transmettant les donnees sur le patient pour un diagnosticcomplementaire) [34, 35],

– ou assurer une surveillance a domicile des patients : telesurveillance (par exemple,suivi des personnes agees a domicile [36, 37], suivi d’une grossesse a risque, etc.).

1.3.2 Evolution : passe, present et futur

La mise en œuvre d’architectures de telemedecine necessite la prise en compte deselements suivants : des reseaux ouverts, des bases de donnees medicales, des moyens derepresentation et d’echange de donnees biomedicales numeriques, des outils et des in-terfaces de communication multi-acteurs et multimedias, des algorithmes de detectionimmediate d’anomalies, des outils et des interfaces de representation dynamique desdonnees. De nombreux projets europeens, dans le cadre des programmes AIM (AdvancedInformatics in Medicine) et Health Telematics ont permis de realiser des avancees signifi-catives dans ce domaine en creant de nouveaux concepts et des standards a chaque niveaude cette architecture [38, 39, 40, 41].

Ainsi, en cardiologie, une premiere etape, sans doute la plus fondamentale pour l’ou-verture des systemes d’information medicale au benefice de la Sante Publique, a ete laconception et l’implementation du protocole de communication standard SCP-ECG (Stan-dard Communications Protocol for Computerized Electrocardiography) [42, 43, 44]. Ceprotocole propose un standard universel pour l’echange de donnees ECG (contenu et for-mat des donnees), donne des directives pour l’encodage des signaux ECG, et inclut aussiun protocole de transport approprie, le tout base sur le modele OSI. Une deuxieme etapea ete le developpement d’un modele conceptuel de reference pour l’archivage des donneeselectrocardiographiques pouvant etre transmises via le protocole SCP-ECG, et compatibleavec toutes les options de ce dernier. Ce modele est l’un des resultats majeurs du pro-jet ŒDIPE (Open European Data Interchange and Processing for Electrocardiography,1992-1995) [45, 46].

Mais le contexte societal actuel est en train de changer. Du fait du vieillissement despopulations. . . , on s’oriente de plus en plus vers des approches de type ”soins a domicile”et de ”self-care” et plus generalement vers la telemedecine citoyenne.

La principale consequence est une reorientation fondamentale des centres d’interet del’informatique medicale qui ne sont plus focalises sur les professionnels de sante mais surles consommateurs (citoyens/patients) (Figure 1.3). Le patient devient l’acteur principaldu systeme a l’instar d’EPI-MEDICS ou le patient enregistre ses propres ECG et docu-mente ses propres symptomes. Cette evolution est favorisee par une utilisation de plusen plus frequente de systemes embarques intelligents et communicants et la federation dedifferents faits et acquis issus de la recherche : l’utilisation des systemes d’information, le

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 16

Fig. 1.3 – Le centre d’interet de l’informatique medicale traditionnelle est en traind’evoluer des professionnels de sante vers les consommateurs (citoyen/patient). D’apresGunther Eysenbach, Consumer health informatics, BMJ 2000.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 17

developpement d’infrastructures de communication pervasives, mobiles et faciles a utili-ser, la miniaturisation la plus importante possible des microcomposants, la baisse de leurcout et l’augmentation de leurs performances, et la construction de systemes de gestionbases sur le contexte et des interfaces naturelles et personnalisees.

Un exemple type de cette evolution vers la telemedecine citoyenne est le projet EPI-MEDICS, que nous presentons brievement ci-apres.

1.3.3 EPI-MEDICS

Le projet EPI-MEDICS (Enhanced Personal Intelligent & Mobile System for Detection& Interpretation of Cardiovascular Syndromes) (Figure 1.4) a deux objectifs principaux[47] :

– detecter, aussitot que possible, le debut d’une ischemie ou d’une arythmie en enre-gistrant les changements des ECG des patients a risque,

– impliquer sans delai, mais seulement si necessaire, les structures de sante.

Pour realiser ces objectifs et en particulier pour detecter de maniere precoce les dys-fonctionnements cardiaques des l’apparition des premiers symptomes, a domicile ou enambulatoire, EPI-MEDICS a developpe un moniteur personnel d’ECG (PEM : PersonalECG Monitor) (Figure 1.5) peu couteux, de petite taille, intelligent et facile d’utilisation,dote d’un serveur embarque et d’un composant metier d’analyse quantitative de l’ECG.

Le PEM est capable d’enregistrer un ECG 3D simplifie contenant la quasi-totalite desinformations spatio-temporelles produite par l’activite du cœur et d’envoyer via Bluetoothet GPRS ou UMTS differents types de messages ou d’alarmes convoyant des ECG et unmini-dossier medical de l’utilisateur aux services de sante concernes, grace a des telephonesportables de 2eme ou 3eme generation. Le seul equipement requis pour les professionnelsde sante est une connexion Internet. Tous les messages du patient aux medecins sont ecritsen XML [48] et encapsulent les donnees des ECG suivant le standard SCP-ECG. Ce modede fonctionnement est cense faciliter l’acceptation du PEM par les professionnels de santeet devrait permettre une tres large diffusion de ce concept.

Le systeme de decision embarque dans le PEM comporte quatre sous-ensembles :detection des arythmies 5, des ischemies 6, generation d’alarmes et de leur niveau prenantsi possible en consideration des informations cliniques telles que les facteurs de risque dupatient, gestion de l’envoi des alarmes tenant compte des non-reponses eventuelles desserveurs d’alarme ou des professionnels de sante contactes, etc.

5Dereglement dans le systeme de conduction electrique du coeur (rythme trop lent lorsqu’il s’agit debradycardie ; ou trop rapide, on parle alors de tachycardie) pouvant entraıner des consequences plus oumoins graves : etourdissements, nausees, vertiges, palpitations, douleurs, etc.

6Arret ou insuffisance de la circulation sanguine dans une partie du corps ou un organe, qui prive lescellules d’apport d’oxygene et entraıne leur necrose. Les infarctus sont consecutifs a des ischemies.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 18

Fig. 1.4 – Le projet EPI-MEDICS permet, grace a un systeme personnel d’enregistrementde l’ECG, lorsqu’un probleme est detecte dans l’ECG d’un patient, et selon le niveau degravite evalue, de prevenir le medecin du patient et/ou le service d’urgence. Les donneesmedicales sont alors disponibles sur le Web et grace a un acces securise, les professionnelsde sante peuvent prendre en charge le patient et orienter correctement ses soins.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 19

Fig. 1.5 – Illustration d’un des 70 prototypes PEM (Personal ECG Monitor) developpesdans le cadre du projet EPI-MEDICS pour permettre la detection precoce des syndromescardiaques dans un contexte de telemedecine citoyenne.

La realisation de la plateforme decisionnelle du PEM n’a ete rendue realisable quegrace a l’apport de differentes techniques d’intelligence artificielle automatisant les pro-cessus d’aide a la decision implementes dans le PEM. Tous ne sont d’ailleurs pas encoreoperationnels. Seuls ont ete experimentes sur le terrain une premiere version des modulesde detection d’arythmies et d’ischemie et de generation des alarmes. Leur optimisationet plus particulierement la prise en compte des informations cliniques pour ameliorer ladecision constituent justement l’un des principaux apports de ce memoire.

Dans la suite de ce chapitre, nous exposerons brievement l’evolution de l’aide a ladecision en medecine, en mettant l’accent sur les systemes d’aide a la decision et en generalles principales methodes developpees dans le cadre de cette discipline. Dans le chapitre2, nous presenterons en detail les techniques que nous avons adoptees pour concevoir lesmodules decisionnels susceptibles d’etre integres dans la plateforme d’aide a la decisiondu PEM : le module d’interpretation de l’ECG et celui de la stratification des facteurs derisque. Enfin, dans le chapitre 4, nous presenterons les aspects lies au deploiement de cesmodules d’aide a la decision, des modules de gestion et d’envoi d’alarme, . . . qui ont ouqui vont etre installes dans le PEM.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 20

1.4 L’aide a la decision en medecine

1.4.1 Generalites

La medecine est une discipline qui requiert une prise de decision. Ce processus resultede la confrontation d’un probleme reel a l’experience acquise (savoir-faire) et a un corpusde connaissances theoriques (savoir) dans le but d’effectuer un choix. La difficulte de laprise de decision en medecine vient de la situation d’incertitude, qui tient a plusieursraisons :

– l’incertitude sur les connaissances : certaines connaissances sont d’ordre statistiqueet sont associees par nature a un risque d’erreur, mais d’autres connaissances sontincompletes, par defaut d’exploration ;

– l’incertitude sur les faits : la description de l’etat present n’est jamais parfaite, soitpar manque de moyens ou de temps (urgence), soit par defaut de mesure ou mauvaiseinterpretation d’un symptome, d’un signe ou d’un resultat ;

– l’incertitude du langage : le flou et l’ambiguıte des notions manipulees perturbentle traitement et la transmission de l’information.

1.4.2 Les systemes d’aide a la decision

Les avancees de l’informatique et plus particulierement l’avenement des systemes d’in-formation, les bases de donnees, les dossiers informatises, etc. ont facilite la prise dedecision medicale en ameliorant l’acces aux donnees pertinentes. Neanmoins, il ne s’agitla que d’une aide indirecte facilitant l’acces aux presentations des faits sur lesquels le pra-ticien doit appliquer un raisonnement. Les systemes d’aide a la decision vont beaucoupplus loin : ils ont l’ambition d’assister l’homme, et dans certaines situations, en parti-culier a domicile ou en ambulatoire, a le suppleer en remplacant ou en reproduisant leraisonnement humain [49].

Caracteristiques

Plusieurs caracteristiques permettent de decrire les systemes d’aide a la decision sui-vant le type de probleme a resoudre, le mode d’intervention, la nature de l’interaction, ouenfin la technique employee.

Applications

Les systemes d’aide a la decision peuvent s’appliquer a deux types de problemes :

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 21

– un probleme de diagnostic (par exemple, categoriser un ECG en normal ou suspect)dans le but de separer ce qui est de ce qui n’est pas, compte tenu de l’incertitudesur la situation reelle de l’objet d’etude ;

– un probleme d’optimisation dans le but d’indiquer la demarche la plus efficace (parexemple, une strategie therapeutique) compte tenu de l’objectif et des contraintes(cout, risque, difficulte, environnement).

Fonctionnement

Plusieurs modes de fonctionnement sont possibles :

– le mode passif suppose l’intervention explicite et directe de l’utilisateur pour decrirele probleme (par exemple, l’etat du patient) et interroger le systeme.

– le mode semi-actif correspond a un systeme dont le declenchement automatiquerepond a une intervention humaine (par exemple, le systeme d’alarme qui alerte surun changement d’etat du patient, comme dans le cadre d’EPI-MEDICS).

– le mode actif est celui d’un systeme a declenchement automatique et autonome (parexemple, un systeme de telesurveillance).

1.4.3 Les principales approches utilisees pour l’aide a la decision

Les methodes utilisees pour l’aide au diagnostic relevent toutes de la reconnaissance deformes. Des centaines d’articles et de livres ont ete ecrits sur le sujet [50]. Les principalesapproches sont : l’approche statistique, syntaxique, les systemes a base de connaissances,les reseaux de neurones. Il n’est pas dans notre objectif de presenter en detail l’ensembledes methodes developpees par le passe, mais juste celles qui nous semblent les plus per-tinentes dans notre contexte applicatif. On trouvera une revue de detail des differentesmethodes dans l’article de synthese de Jain et al [51] qui insistent en outre sur l’impor-tance de la phase d’extraction des caracteristiques qui precede la reconnaissance de formeselle-meme et montrent l’interet de combiner plusieurs classifieurs.

Approche neuronale

Il s’agit de methodes inspirees des structures neuronales et du fonctionnement cerebral,d’ou le nom frequent de reseau de neurones artificiels [52].

Le reseau neuronal est un programme qui met en jeu des neurones relies entre eux pardes connexions. Chaque neurone realise la sommation des stimuli des neurones afferents,chaque connexion etant affectee d’une ponderation. Cette sommation obeit a differentesformes de fonctions, dites de transfert ou d’activation (tout ou rien, fonction en escalier,

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 22

sigmoıde. . . ), et si le resultat depasse un certain seuil d’activation, alors le neurone envoieun stimulus aux neurones afferents.

Approche statistique

L’approche statistique [53] concerne essentiellement les methodes de regression oude classement multidimensionnelles qui permettent d’expliquer la valeur d’une reponse oul’appartenance a un groupe en fonction des valeurs de plusieurs variables dites explicatives.

Il s’agit notamment de l’analyse discriminante, de la regression logistique dans le casd’une reponse qualitative, de la regression multiple dans le cas d’une reponse quantitative,ou du modele de Cox dans le cas d’une variable de reponse censuree (analyse de survie).Ces methodes repondent a deux objectifs : reduire le nombre souvent considerable devariables potentiellement explicatives a un sous-ensemble d’usage et obtenir d’une maniereplus aisee une equation predictive.

Etant probablement la methode statistique de classement la plus utilisee, l’analysediscriminante lineaire est une methode de reconnaissance de formes statistique basee surune technique d’apprentissage supervise, tres facile a mettre en œuvre [54]. Le but estde determiner la classe d’une observation en calculant la distance de Mahalanobis entrel’observation et le centre de chacune des classes et en affectant l’observation a la classepour laquelle la distance de Mahalanobis est minimale.

Le modele est etabli a partir d’un un ensemble d’observations (ensemble d’apprentis-sage) pour lesquelles les classes sont connues. A partir de cet ensemble d’apprentissage,l’analyse discriminante etablit un ensemble de fonctions lineaires des facteurs predictifs,connues sous le nom de fonctions discriminantes, du type :

Y = v1X1 + v2X2 + . . . + vnXn + C (1.1)

ou les vi sont des coefficients discriminants, les xi sont les variables d’entree (les facteurspredictifs) et le C est une constante.

Ces fonctions discriminantes sont employees pour prevoir la classe d’une nouvelle ob-servation. Pour un probleme de classement avec k classes, k fonctions discriminantes sontconstruites. Etant donnee une nouvelle observation, toutes les fonctions discriminantes

sont evaluees et l’observation est assignee a la classe i si la ieme fonction discriminante ala valeur la plus elevee.

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 23

Approche probabiliste

L’approche probabiliste, reposant sur l’application du theoreme de Bayes, permet decalculer la probabilite d’une maladie connaissant les signes du malade. L’application surun probleme de diagnostic medical du theoreme de Bayes etablit que la probabilite aposteriori d’un diagnostic Di, lorsque le signe S est present, est fonction de la probabilitea priori du diagnostic et de la probabilite conditionnelle d’observer le signe lorsque lediagnostic est present :

P (Di/S) =P (Di)× P (S/Di)

P (S)=

P (Di)× P (S/Di)

(∑

j P (Dj)P (S/Dj))(1.2)

La methode bayesienne tient compte des signes positifs et negatifs et permet de calculerle diagnostic le plus probable [55]. La determination des probabilites a priori (incidencede la maladie) et des probabilites conditionnelles (frequence d’un signe dans une mala-die) suppose l’exploitation d’une base de donnees medicales enregistrant les signes et lediagnostic de chaque cas.

Approche symbolique

Il s’agit essentiellement des systemes dits ”experts” [56] qui sont des logiciels deresolution de problemes, qui permettent de representer sous forme explicite et declarativeles connaissances et le comportement d’un expert humain, afin qu’il puisse etre reproduitpar un programme. Les limites de cette approche tiennent aux contraintes de formulationde la connaissance (connaissance imparfaite, relations multiples, difficulte de formalisationdu raisonnement, contrainte du dialogue avec l’utilisateur, necessite de consensus).

1.4.4 Conclusion

L’aide a la decision est une discipline qui a suscite beaucoup d’interet au cours desdernieres decennies et enormement de methodes ont deja vu le jour. Cependant, aucunemethode ne s’est imposee comme etant ”la methode de reference” et la tendance au coursde ces dernieres annees fut l’essor des systemes hybrides ou les resultats de plusieursmethodes d’aide a la decision sont combines. En effet, a l’instar des systemes multi-expertsou la combinaison des interpretations de plusieurs experts est plus performante que cellede chacun des experts pris individuellement [25], la combinaison des resultats de plusieursclassifieurs (comites de reseaux de neurones) conduit a des resultats de meilleure qualiteque ceux du meilleur classifieur (meilleur reseau de neurones du comite) [57]. De meme,la combinaison des resultats de plusieurs methodes de classement (fusion de donneesvia des heuristiques entre un comite de reseaux de neurones et un reseau bayesien) seraprobablement plus performante que n’importe quelle methode consideree individuellement

Chapitre 1. Maladies cardiovasculaires, telemedecine et aide a la decision 24

[58]. C’est ce concept que nous allons developper dans le prochain chapitre : Aide a ladecision en telecardiologie.

Troisieme partie

Conception, validation et strategiesde deploiement de la plateforme

decisionnelle d’EPI-MEDICS

25

Chapitre 2

Aide a la decision en telecardiologie

2.1 Contexte et objectifs

Comme deja indique dans l’introduction de ce memoire, l’objectif principal d’EPI-MEDICS est de permettre la detection precoce de l’infarctus du myocarde des l’appa-rition des premiers symptomes afin de pouvoir intervenir rapidement et administrer untraitement immediat et efficace.

Dans ce contexte, l’ECG, grace a son caractere non-invasif, sa rapidite de mise enœuvre, et son faible cout reste un examen objectif de choix. Cependant, comme evoquedans le chapitre 1, sa performance diagnostique reste limitee. Ainsi Pope et al [18] ontmontre qu’en pratique clinique lorsque l’on applique les criteres ECG classiques de diag-nostic de l’infarctus, au moins 25% des patients qui avaient un infarctus du myocardene sont pas diagnostiques et sont renvoyes de l’hopital sans traitement. Sans doute denouvelles methodes de reconnaissance de forme combinees a de nouvelles methodes detraitement du signal (analyse en ondelettes, etc.) pourront elles permettre d’ameliorerces performances. Les resultats de l’action CSE ont montre en effet que les meilleursprogrammes d’analyse automatique de l’ECG sont aussi performants que les meilleurscardiologues [25]. Mais il faut savoir aussi que la performance des cardiologues est accruelorsqu’ils connaissent le contexte du patient. En effet, de nombreuses etudes [59, 60, 61, 62]ont montre que l’analyse de l’ECG combinee avec l’historique clinique et les resultats desdernieres analyses medicales du patient est le meilleur moyen pour effectuer un diagnos-tic precoce de l’infarctus du myocarde, en particulier dans un contexte d’urgence ou enambulatoire.

La principale problematique est donc de pouvoir trouver la meilleure solution pourfusionner des donnees de nature differente (dichotomique, categorique et continue), enprovenance de sources diverses (ECG, donnees cliniques,. . . ) afin d’etablir un score derisque et declencher une alarme appropriee. Or ce domaine de la fusion de donnees estdevenu particulierement important pour un grand nombre d’applications tels que la ro-

Chapitre 2. Aide a la decision en telecardiologie 27

botique, l’interpretation d’image ou dans notre contexte, la telemedecine. De nombreusesapproches ont ete developpees afin d’assurer une combinaison optimale des donnees. AussiJeanpierre et al. [63] et Bellot et al. [64] ont developpe une approche de fusion de donneesdans le cadre d’une application de telemedecine. Il s’agit du projet Diatelic qui a pourobjectif d’assister a domicile des personnes souffrant d’insuffisance renale a travers unrecueil regulier de donnees aupres patient (poids, tension, temperature,. . . ) a l’aide decapteurs. Ces donnees, heterogenes, incertaines et bruitees sont fusionnees au sein d’unreseau bayesien dynamique afin de pouvoir etablir un diagnostic. Enfin, pour passer d’unemesure absolue (poids du patient) a une mesure relative prenant en compte la specificitedu patient, on fait appel a des operateurs de logique floue.

Mettre au point de nouvelles methodes de fusion de donnees dans le domaine dela telecardiologie impose que l’on puisse disposer de bases de donnees encapsulant pourchaque patient a la fois des ECG, des donnees cliniques et son historique medical recueillisde facon synchrone. Malheureusement, il n’existe pas encore de telles bases de donneescontenant un nombre significatif de cas. A l’inverse, il existe un certain nombre de bases dedonnees collectees sur differentes populations de patients mais comportant soit des ECG,soit des donnees cliniques. En l’absence de bases de donnees synchrones bien documentees,l’alternative est donc :

– d’exploiter separement les bases de donnees ECG et les bases de donnees cliniques,

– de developper separement des modules d’interpretation de l’ECG et de stratificationdes facteurs de risque,

– enfin de concevoir des scenarios de collaboration entre ces differents modules.

C’est cette approche que nous allons developper tout au long de ce chapitre enpresentant tout d’abord une methode d’interpretation automatique de l’ECG mettanten œuvre des comites de reseaux de neurones artificiels optimises pour diagnostiquerles infarctus aigues, puis une methode visant a quantifier l’importance du risque cardio-vasculaire au moyen d’un reseau bayesien. Enfin nous proposons un modele de diagnosticcardiologique global combinant les resultats de l’interpretation de l’ECG et de l’evaluationdes facteurs de risque.

2.2 Interpretation automatique de l’ECG

Il existe de par le monde plusieurs dizaines, voire plusieurs centaines de programmesd’interpretation automatique de l’ECG. La plupart sont bases sur une approche heuris-tique ou melangent approche heuristique et approche statistique. En effet, peu de pro-grammes bases sur une approche statistique pure ou sur des reseaux de neurones ont recuune acceptabilite suffisante du corps medical qui exige generalement qu’un programmed’interpretation automatique de l’ECG justifie, en termes medicaux comprehensibles parl’ensemble des professionnels de sante, les raisons de la decision.

Le contexte d’application d’un tel module dans le cadre du projet EPI-MEDICS est

Chapitre 2. Aide a la decision en telecardiologie 28

tout autre car ici l’on cherche avant tout a privilegier la performance de la detectiond’une ischemie ou d’un infarctus aigue en minimisant le nombre de faux positifs et defaux negatifs sachant que par ailleurs l’on envoie l’ECG au cardiologue pour qu’il puissecontroler s’il le juge utile la qualite de l’interpretation. Dans ce contexte, l’utilisation decomites de reseaux de neurones artificiels paraıt extremement pertinente. Les reseaux deneurones en effet constituent un paradigme informatique de reconnaissance de formes quis’est avere tres prometteur pour resoudre des applications de medecine en general [65] etplus particulierement le diagnostic de l’infarctus. De nombreuses etudes ont demontre laqualite de l’interpretation automatique de l’ECG par reseaux de neurones dans le cadred’un scenario de diagnostic de l’infarctus du myocarde. Parmi ces etudes, il convient deciter plus particulierement Baxt [66] et Harrison et al. [67] qui ont utilise l’historiquemedical du patient ainsi que des donnees d’ECG et des donnees cliniques comme entreesdu reseau de neurones. Des etudes plus recentes [68, 69] ont utilise les reseaux de neuronesdans le but de faire un outil d’aide a la decision dedie aux services d’urgence. Utilisantuniquement l’ECG 12D comme donnees d’entree au reseau de neurones, Heden et al. [70]pouvaient detecter l’infarctus avec un taux de reussite egal voire meilleur qu’a celui d’uncardiologue experimente. Une autre etude [22] a montre l’interet d’utiliser des parametresseriels de l’ECG pour diagnostiquer l’infarctus.

Dans le reste de cette section, nous allons presenter les reseaux de neurones, lesmecanismes d’apprentissage ainsi que les techniques d’optimisation, en particulier l’ap-proche multi-expert par des comites de reseaux de neurones. Ensuite, nous allons presenterles methodes statistiques utilisees comme temoin de comparaison avec les reseaux de neu-rones : l’analyse discriminante. Enfin, nous presentons les evaluations effectuees sur unebase de donnees ECG, la base de donnees de Lund, par rapport a l’analyse discriminanteet deux experts humains : un cardiologue experimente et un medecin interne.

2.2.1 Les reseaux de neurones

Definition

Les reseaux de neurones artificiels sont des modeles de calcul dont la conception esttres schematiquement inspiree du fonctionnement cerebral et des structures neuronales.Ils sont generalement optimises par des methodes d’apprentissage de type statistique quileur permettent de prendre des decisions s’appuyant davantage sur la perception que surle raisonnement logique formel [71].

Couches, connexions et fonctions d’activation

Un reseau de neurones est ainsi constitue de neurones connectes par des liaisons quipermettent a chaque neurone d’envoyer et recevoir des signaux en provenance des neurones

Chapitre 2. Aide a la decision en telecardiologie 29

qui le precedent. Chacune de ces connexions recoit une ponderation qui determine sonimpact sur les neurones qu’elle connecte. Chaque neurone dispose ainsi d’une entree,qui lui permet de recevoir de l’information d’autres neurones, mais aussi d’une fonctiond’activation, qui est dans les cas les plus simples, une simple fonction identite du resultatobtenu par l’entree, et enfin une sortie (Figure 2.1).

Fig. 2.1 – Fonctionnement des neurones : chaque neurone m additionne les valeurs de sesentrees (n1, n2, n3) multipliees par des poids (W1, W2, W3), passe le resultat dans unefonction d’activation, et le renvoie aux neurones qui le suivent.

Le choix d’une fonction d’activation se revele etre un element constitutif importantdes reseaux de neurones. Le plus souvent des fonctions non lineaires seront necessaires.Les fonctions couramment utilisees comme fonctions d’activation sont (Figure 2.2) :

– La fonction logistique :

Y = F (X) =1

(1 + e(−dX))(2.1)

– La fonction tangente hyperbolique :

Y =2

(1 + e(−2X))− 1 (2.2)

– Les fonctions a seuil telles que :

Y =[0 si X < 01 si X > 0 (2.3)

Types de reseaux

Les reseaux de neurones ont suscite beaucoup d’interet au cours des dernieres decennieset enormement de variantes ont deja vu le jour : les perceptrons multi-couches [72], lesreseaux de Kohonen [73, 74], les reseaux de Hopfield [75], etc.

Les perceptrons multi-couches L’exemple de reseau de neurones le plus utilise restele perceptron multi-couches (Figure 2.3). Dans un perceptron, les neurones sont organisessuivant une couche d’entree, une couche de sortie, et une ou plusieurs couches cachees quiassurent la connexion entre l’entree et la sortie du reseau :

Chapitre 2. Aide a la decision en telecardiologie 30

(a) La fonction logistique. (b) La fonction tangente hyperbo-lique.

(c) La fonction a seuil.

Fig. 2.2 – Exemples de fonctions d’activation.

– La couche d’entree recoit les donnees sources que l’on veut utiliser pour l’analyse.Dans le cas de l’aide au diagnostic medical, cette couche recevra les symptomes. Sataille est donc directement determinee par le nombre de variables d’entrees.

– La couche de sortie donne le resultat obtenu. Dans le cas de l’aide au diagnosticmedical, cette couche donne le diagnostic sous forme d’une probabilite entre 0 (sujetsain), et 1 (diagnostic confirme). Sa taille est directement determinee par le nombrede variables (ou diagnostic) qu’on veut en sortie.

– La couche intermediaire est dite cachee dans le sens qu’elle n’a qu’une utilite in-trinseque pour le reseau de neurones et n’a pas de contact direct avec l’exterieur.

Le principe de fonctionnement est le suivant : nous disposons initialement d’une basede connaissances constituee de couples de donnees entrees / sorties (symptomes, signescliniques / pathologie) et nous souhaitons utiliser cette base de donnees pour configureret ”entraıner” le reseau de neurones, grace a un algorithme informatique, a reproduire lesassociations constatees entre les entrees et les sorties de la base de connaissances.

Les fonctions d’activation de la couche cachee sont en general non lineaires mais il n’ya pas de regle a respecter. Le choix du nombre de couches cachees et de leur taille n’est pasimplicite et doit etre ajuste. En general, plusieurs tests sont necessaires. On commencepar exemple par prendre une moyenne du nombre de neurones des couches d’entree et desortie, mais ce n’est pas toujours le meilleur choix. Il est donc souvent necessaire, pourobtenir de bons resultats, d’essayer le plus de tailles possibles.

Chapitre 2. Aide a la decision en telecardiologie 31

Fig. 2.3 – Illustration d’un reseau de neurones de type perceptron multi-couches.

Les etapes de conception d’un reseau de neurones

Choix et preparation des echantillons Le processus d’elaboration d’un reseau deneurones commence par le choix et la preparation des echantillons de donnees. En generalune partie de l’ensemble de donnees est simplement ecarte de l’echantillon d’apprentissageet conserve pour les tests hors echantillon afin de verifier la capacite de generalisation dureseau.

Elaboration de la structure du reseau La structure du reseau depend etroitementdu type de reseau : un perceptron standard, un reseau de Hopfield, un reseau de Kohonen,etc. Ensuite en fonction du type choisi, l’elaboration de la structure du reseau peut varier :dans le cas du perceptron, il faudra aussi determiner le nombre de neurones dans la couchecachee.

Apprentissage L’apprentissage consiste a calculer les ponderations optimales desdifferentes liaisons du reseau de neurones, en utilisant un echantillon de donnees (parexemple une base de donnees ECG, ou les parametres de l’ECG alimentent l’entree dureseau et le diagnostic medecin de l’ECG sert comme verite clinique et sera compare parrapport a la sortie du reseau). L’apprentissage peut se faire de differentes manieres :

– Le mode supervise : dans ce type d’apprentissage, le reseau s’adapte par comparai-son entre le resultat qu’il a calcule, en fonction des entrees fournies, et la reponseattendue en sortie. Ainsi, le reseau va se modifier jusqu’a ce qu’il trouve la bonnesortie, c’est-a-dire celle attendue, correspondant a une entree donnee.

– Le mode non-supervise : Dans ce cas, l’apprentissage travaille sur un ensemble dedonnees sans information prealable sur le nombre de classes et sur la classe desechantillons. Il est generalement base sur des probabilites. Le reseau va se modifieren fonction des regularites statistiques de l’entree et etablir des categories, en at-tribuant et en optimisant un critere d’appartenance aux categories identifiees par

Chapitre 2. Aide a la decision en telecardiologie 32

l’apprentissage.

Par la suite, dans le cadre de notre application, du fait que nous disposons de la verite surla sortie du reseau, nous nous interesserons surtout a l’apprentissage supervise que nousallons detailler ci-apres.

Apprentissage par retropropagation La methode d’apprentissage supervise la plusutilisee est la retropropagation [76]. Le principe de la retropropagation consiste a alimenterle reseau de neurones par les donnees de l’ensemble d’apprentissage, et en fonction del’erreur obtenue en sortie par rapport a la verite (sortie de l’ensemble), nous corrigeonsles poids accordes aux neurones.

– On ”montre” chaque exemple au reseau de neurones, puis on propage ces valeursvers la sortie. La prediction que l’on obtient en sortie est au debut erronee.

– On calcule la valeur de l’erreur (c’est a dire la difference entre les valeurs desireeset les valeurs predites), puis on ”retropropage” cette erreur en remontant le reseauet en modifiant les poids proportionnellement a la contribution de chacun a l’erreurtotale.

– On repete ce mecanisme pour chaque exemple de donnees et tant que le taux dereclassement sur les donnees s’ameliore.

Il faut bien prendre garde cependant de ne pas surentraıner un reseau de neurones en luifaisant ”apprendre par coeur” car il deviendrait alors moins performant. Il existe diversestechniques qui permettent d’eviter de tomber dans le phenomene de sur-apprentissagetelles que la validation croisee (cross-validation), et l’arret precoce (early stopping) :

– L’arret precoce consiste a diviser l’ensemble d’apprentissage en deux sous-ensembles.Le premier sous-ensemble sert a entraıner le reseau. Le deuxieme sous-ensemble, ditde validation, joue le role d’arbitre de telle sorte que le cycle d’apprentissage estrepete tant que l’erreur obtenue en sortie sur les donnees de l’ensemble de validationest decroissante.

– La validation croisee consiste a diviser l’ensemble d’apprentissage en N (par exemple5) sous-ensembles egaux et disjoints. L’apprentissage est ensuite effectue sur lesN − 1 sous-ensembles et l’erreur (ei) est calculee sur le sous-ensemble restant, ser-vant de validation. La procedure est repetee N fois, en choisissant a chaque fois unsous-ensemble de validation different. Enfin, un taux d’erreur moyen (E) est cal-cule et l’apprentissage est refait en utilisant cette fois la totalite de l’ensemble dedonnees avec comme condition d’arret l’erreur moyenne (E) calculee lors de l’etapeprecedente (tableau 2.1)

Techniques d’optimisation

Les reseaux de neurones, dans leur structure meme, permettent de nombreusesameliorations : choix du nombre de couches cachees, du nombre de neurones dans lescouches cachees, du type de fonctions d’activation, etc. Mais la technique la plus per-tinente semble etre la combinaison de differents classifieurs pour former ce que dans la

Chapitre 2. Aide a la decision en telecardiologie 33

Tab. 2.1 – Exemple de validation croisee pour N=5. L’ensemble des donnees d’appren-tissage est divise en 5 sous-ensembles : s1, s2, s3, s4, et s5. L’apprentissage est ensuiteeffectue sur les N − 1 sous-ensembles s2 a S5 et l’erreur est calculee sur le sous-ensemblerestant s1, servant de validation. Cette operation est reiteree quatre fois en choisissantchaque fois un ensemble de validation different. Enfin, un taux d’erreur moyen est calculeet l’apprentissage est refait en utilisant la totalite de l’ensemble de donnees.

Serie d’apprentissage Validation

s2 s3 s4 s5 s1s1 s3 s4 s5 s2s1 s2 s4 s5 s3s1 s2 s3 s5 s4s1 s2 s3 s4 s5

litterature on qualifie de comites ou ensembles de reseaux de neurones. L’objectif estd’ameliorer la capacite de generalisation en combinant plusieurs reseaux individuels en-traınes a effectuer la meme tache, ce qui produit une performance largement superieurea celle obtenue par chaque reseau individuel. L’interet et l’efficacite de l’approche ensem-bliste pour ameliorer la performance des reseaux de neurones ont deja ete justifies a lafois theoriquement [77, 78] et empiriquement [79].

La creation d’un comite de reseaux de neurones est souvent divisee en deux etapes [80].La premiere est la creation des reseaux individuels composants le comite et la seconde estla combinaison appropriee de ces reseaux pour produire la sortie du comite. La facon etl’impact de combiner les sorties individuelles ont ete etudie dans [78]. Dans cet article,on a montre que l’erreur quadratique realisee par le comite, lorsqu’il s’agit de realiserune prediction unique, est egale a l’erreur quadratique moyenne des reseaux individuelsdiminuee de la diversite, definie comme etant la variance des sorties des reseaux indivi-duels. C’est la raison pour laquelle, pour reduire l’erreur sur le comite, il faut augmenterla diversite, sans trop augmenter les erreurs des reseaux individuels.

La methode la plus simple pour creer des comites de reseaux de neurones est d’en-traıner, sur un meme ensemble d’apprentissage, une selection de reseaux individuels choisisavec un parametrage aleatoire initial des poids. Comme l’initialisation des poids est faitealeatoirement au debut, les reseaux evoluent differemment dans la phase d’apprentissage etdonnent donc des resultats sensiblement differents. Une approche plus elaboree consistea entraıner chacun des reseaux du comite sur un sous-ensemble different de l’ensembled’apprentissage initial. Les variantes de cette approche sont diverses. Dans la techniquedu ”Bagging” [81], chaque sous-ensemble d’apprentissage est tire uniformement, avec re-mise, de l’ensemble initial. La prediction finale est basee sur la sortie des divers reseaux ducomite : moyenne des sorties, vote majoritaire des classifieurs, etc. Le Boosting [82] utiliseaussi le tirage avec remise, mais les echantillons sont construits de facon a favoriser le tiragedes exemples consideres comme difficiles a classer par le reseau precedent. La prediction fi-

Chapitre 2. Aide a la decision en telecardiologie 34

nale est une combinaison (vote pondere) des diverses predictions. Une troisieme approcheconsiste a realiser une selection ciblee (a la place d’une simple selection aleatoire) duparametrage initial des poids des reseaux [83, 84, 85]

Enfin, les performances des reseaux de neurones peuvent etre ameliorees an appliquantun pre-traitement des donnees, tels que l’analyse en composantes principales (ACP).L’ACP sur les donnees en entree du reseau permet en effet de ne garder que les ca-racteristiques importantes des donnees de depart et se concretise en general par un ap-prentissage plus efficace du reseau de neurones [22, 86].

2.2.2 Conception, realisation et evaluation du module d’in-terpretation de l’ECG par reseaux de neurones

Developper une nouvelle methode de reconnaissance de formes et en particulier unnouveau module d’interpretation automatique de l’ECG necessite de pouvoir disposerd’un ensemble d’apprentissage et de test consequent et de s’assurer de la qualite et dela robustesse des algorithmes developpes en effectuant des evaluations rigoureuses parcomparaison par rapport aux experts humains.

Grace aux cooperations instaurees par le projet EPI-MEDICS, nous avons eu la chancede pouvoir acceder a une base de donnees ECG serielles constituee par l’equipe du Pro-fesseur Edenbrandt de l’Universite de Lund en Suede, dont la caracteristique majeureest d’avoir ete collectee dans differents services d’urgence cardiologique des Hopitaux deLund dans le but de constituer une base de donnees de reference pour la mise au pointde systemes d’aide a la decision pour la detection de l’infarctus aigue. Bien que les ECGaient ete collectes a un stade d’evolution de l’ischemie qui est bien posterieur a celuisurvenant en ambulatoire ou au domicile des patients, nous pensons neanmoins que labase de donnees de Lund est une base de donnees majeure, non pas pour optimiser lesprocessus de decision qui seront utilises dans le PEM et qui de toutes facons devrontetre specifiques aux patients, mais au moins pour valider les concepts et l’architecture desreseaux de neurones qui nous allons presenter dans la suite de ce chapitre, juste apres unebreve description de la base de donnees de Lund.

Ensembles d’apprentissage et de test

La base de donnees de Lund est composee d’ECG enregistres sur des patients qui sesont presentes au service des urgences de l’Hopital Universitaire de Lund (Suede) entrejanvier 1990 et Juin 1997 [22]. Chaque ECG a ete classe dans l’une des deux categoriessuivantes :

1. AMI (Acute Myocardial Infarction), si l’ECG enregistre provenait d’un patient pourlequel le diagnostic d’infarctus a ete confirme lors de sa sortie de l’unite des soins

Chapitre 2. Aide a la decision en telecardiologie 35

coronariens avec un diagnostic d’infarctus.

2. Controle, si l’ECG enregistre provenait d’un patient pour lequel le diagnosticconfirme etait un diagnostic autre que AMI.

Pour chaque ECG enregistre, un ECG precedent du meme patient a ete selectionnedans la base de donnees de l’hopital. Les ECG de la categorie AMI et leurs predecesseursont ete regroupes dans le groupe AMI et les paires correspondant a la categorie controleont ete assignees au groupe de controle.

Le diagnostic d’AMI a ete etabli si au moins 2 des 3 criteres suivants ont ete confirmes :une douleur thoracique caracteristique durant au moins 20 min, un niveau eleve de creatinekinase (CK), ou des changements electocardiographiques seriels caracteristiques. Des va-leurs de creatine kinase-MB > 0.23 mkat/L ainsi qu’une augmentation et une diminutiontypiques ont ete utilises pour diagnostiquer l’AMI. Les marqueurs electrocardiographiquede l’AMI sont : une apparition d’une onde Q dans au moins 2 derivations contigues et/ouune inversion de l’onde T presente dans au moins 2 derivations contigues apres un sus-decalage du segment ST dans ces derivations. Enfin, un cardiologue experimente a validechaque diagnostic.

Les ECG ont ete recueillis par un electrocardiographe 12 derivations et echantillonnesa une frequence de 1000 Herz. Pour chaque ECG, on dispose d’un complexe median P-QRS-T d’une duree de 1 sec representatif de l’enregistrement de 10 sec d’origine. Lapopulation d’etude consiste en un total de 4691 paires d’ECG. Le groupe final d’AMI estcompose de 902 paires d’ECG (546 hommes et 356 femmes, age : m ± σ = 74 ± 11 ans)et le groupe final de controle de 3789 paires d’ECG (1954 hommes et 1835 femmes, age :m ± σ = 70 ± 15 ans).

Interpretation des ECG par des experts humains

Chaque ECG d’urgence de la base de donnees de Lund a ete interprete de maniereindependante par un cardiologue experimente et par un medecin interne, d’abord en netenant compte que du seul ECG enregistre dans le service d’urgence, puis en tenantcompte de l’ECG de reference. Les ECG ont ete classes dans les categories suivantes :

1. D1 : Infarctus confirme.

2. D2 : Infarctus probable.

3. D3 : Infarctus peu probable.

4. D4 : pas d’infarctus.

Ces diagnostics ont ete etablis en n’ayant aucune autre information a leur disposition queles ECG et les dates d’acquisition des deux ECG (analyse serielle).

Chapitre 2. Aide a la decision en telecardiologie 36

Methodes

En situation d’urgence et egalement dans le cadre de l’utilisation du PEM, deux si-tuations peuvent se produire. Soit l’on dispose d’un ECG de reference : dans ce cas il vautmieux realiser une analyse serielle. Soit l’on ne dispose pas d’un ECG de reference car in-existant ou l’on n’arrive pas a le retrouver faute d’un systeme d’information performant :dans ce cas il faudra se contenter d’un programme d’analyse unaire. C’est exactementcette demarche que nous avons suivie en developpant deux versions du programme d’in-terpretation automatique des ECG toutes les deux basees sur des comites de reseaux deneurones de type perceptron multicouches (PMC), l’un de type unaire que nous tenteronssur les enregistrements effectues en urgence, l’autre de type serielle prenant en compte lesparametres de l’ECG reference pour etablir le diagnostic des ECG enregistres en urgence.

La premiere etape a ete de constituer deux ensembles d’apprentissage et de testindependants. L’ensemble de test a ete forme en tirant 988 cas au hasard sur la tota-lite de la base de donnees de Lund (199 cas d’AMI et 789 cas de controle). L’ensembled’apprentissage est compose du reste des 3703 cas (soit 703 cas d’AMI et 3000 cas decontrole).

La deuxieme etape vise a reduire la quantite de donnees. En effet, un programmed’analyse automatique des ECG calcule en moyenne 500 a 1000 descripteurs. Dans notrecas nous disposons pour chaque enregistrement : ECG de reference et ECG d’urgence, de(11×12)= 132 parametres choisis pour leur pertinence eu egard a la detection des AMI[8]. Ils correspondant a 11 mesures caracteristiques des ondes QRS et T sur chacune des12 derivations : duree de QRS ; aire de QRS ; amplitudes de Q, R, et S ; et 6 mesures deST-T : (amplitude de ST-J, pente de ST, amplitude de ST 2/8, amplitude de ST 3/8,amplitude de T positive et amplitude de T negative).

Pour l’ensemble des ECG d’urgence, nous effectuons une analyse en composantes prin-cipales (ACP), afin de reduire le nombre de variables. A l’issue de l’ACP, 16 variables sontconservees : elles correspondent a la duree de QRS, l’aire de QRS, les amplitudes des ondesQ, R et S, les amplitudes de ST et la duree de l’onde T. Ces 16 variables constituerontnotre premier jeu de donnees et seront utilisees pour l’analyse unaire.

Pour permettre l’analyse serielle, une nouvelle analyse en composantes principales esteffectuee sur la difference entre les 132 parametres des ECG courants et ceux des ECG dereference. 16 nouveaux parametres correspondant a l’evolution de la duree de QRS, l’airede QRS, les amplitudes des ondes Q, R et S, les amplitudes de ST et la duree de l’ondeT entre ECG courants et ECG de reference, sont extraits, et, ajoutes aux 16 parametresdecrits ci-dessus, les 32 parametres formeront le deuxieme jeu de donnees.

Ces deux jeux de donnees sont ensuite utilises pour configurer deux comites de reseauxde neurones : le premier pour les parametres unaires et le deuxieme pour les parametresseriels. Les performances obtenues par les deux comites de reseaux de neurones sont enfincompares par rapport aux resultats d’une analyse discriminante effectuee en utilisant les

Chapitre 2. Aide a la decision en telecardiologie 37

memes ensembles d’apprentissage et de test que pour les reseaux de neurones et ceuxobtenus par l’interpretation realisee par deux experts : un cardiologue experimente etun medecin interne. Enfin, pour realiser notre modele de reseaux de neurones, ainsi quetous les tests d’evaluation, nous avons utilise MatlabTM et sa boıte a outils ”reseaux deneurones”. L’analyse discriminante a ete realisee avec le logiciel XLSTATTM.

Realisation du modele de reseaux de neurones Plusieurs parametres sont adeterminer au niveau de l’architecture des reseaux : nombre de neurones sur la couchecachee, fonctions d’activation pour le passage d’une couche a l’autre, algorithme utiliseen apprentissage, etc.

Choix de l’algorithme d’apprentissage Pour les perceptrons multicouches(PMC), Matlab dispose de la version basique de l’algorithme de retropropagation,mais egalement d’une variete d’algorithmes d’apprentissage bases sur le principe deretropropagation qui varient en cout de calcul et vitesse de convergence : les algorithmesde la famille quasi-Newton, ceux bases sur la descente du gradient conjugue, etc. Certainsde ces algorithmes sont adaptes a des taches de classement alors que d’autres sont plusperformants dans l’approximation de fonctions.

Parmi ces algorithmes, la methode de Levenberg-Marquardt [87, 88] est devenue unstandard pour l’optimisation de l’erreur quadratique a cause de ses proprietes de conver-gence rapide et de robustesse. De meme, Levenberg-Marquardt est un algorithme trespuissant d’optimisation non-lineaire ce qui l’a fait adopter pour de nombreuses taches declassement dans divers domaines [89, 90, 91, 92].

Pour notre application, nous avons donc decide d’utiliser l’algorithme de Levenberg-Marquardt. Enfin, pour eviter le sur-apprentissage, nous avons utilise la methode d’arretprecoce (early stopping), deja decrite dans la section 2.2.1.

Choix des fonctions d’activation Le choix de la retro-propagation pour l’ap-prentissage du reseau impose des fonctions derivables. Les fonctions sigmoıdes commela fonction tangente-sigmoıde, la fonction logarithme-sigmoıde ou la fonction gaussiennesont les fonctions usuellement utilisees pour les neurones des couches cachees. Dans notresituation, nous souhaitons avoir en sortie du reseau des valeurs comprises entre 0 et 1,ou un 1 correspond a la categorie AMI et 0 signifie que le cas appartient a l’ensemblede controle. Nous avons donc choisi d’utiliser des fonctions logarithme-sigmoıde a la foispour la couche cachee et celle de sortie.

Choix de l’architecture neuronale Il s’agit de fixer le nombre de couches cacheesainsi que le nombre de neurones dans chaque couche. Le choix d’une seule couche cacheenous a semble etre un bon compromis entre la complexite (et donc le temps de calcul)

Chapitre 2. Aide a la decision en telecardiologie 38

et la performance du reseau. Reste encore le probleme du nombre de neurones qui lacomposent. Il n’y a pas de regles ou de lois en la matiere, et ce nombre se determinesouvent empiriquement. C’est un travail long et fastidieux qui necessite de nombreusesexperimentations. Notre objectif etant dans un premier temps d’evaluer la robustesse desreseaux de neurones, nous avons utilise la configuration utilisee dans [22], a savoir 10neurones sur la couche cachee pour l’analyse unaire (jeu de donnees de 16 variables) et 15neurones pour l’analyse serielle (jeu de donnees de 32 variables). Le nombre de neuronesen entree sera egal au nombre de parametres du jeu de donnees, et la couche de sortie seracomposee d’un seul neurone, indiquant si le patient fait partie de la classe des AMI ou dela classe de controle. Enfin, notre methode se differe sur plusieurs points de la methodeadoptee par Ohlson et al [22] :

– Un parametrage de reseaux de neurones differents (au niveau de la fonction d’acti-vation des neurones de la couche cachee).

– Une difference au niveau de l’apprentissage (version basique vs. la varianteLevenberg-Marquardt de l’algorithme de retropropagation).

– Une politique differente pour eviter le surapprentissage (arret precoce vs. validationcroisee).

La figure 2.4 illustre le fonctionnement du comite de reseaux de neuronesunaires/seriels. Ce comite recoit les 16/32 parametres unaires/seriels et etablit un scorede risque compris entre 0 et 1. Dans le cadre d’EPI-MEDICS 4 niveaux de risque ont etedefini :

– pas de risque : si le score de risque est compris entre 0 et 0.125.

– risque mineur : si le score de risque est compris entre 0.125 et 0.25.

– risque moyen : si le score de risque est compris entre 0.25 et 0.45.

– risque majeur : si le score de risque est superieur a 0.45.

Chapitre 2. Aide a la decision en telecardiologie 39

Fig. 2.4 – Illustration du fonctionnement du comite de reseaux de neurones unaires/serielsutilise pour l’interpretation de l’ECG.

Chapitre 2. Aide a la decision en telecardiologie 40

Tests d’evaluation - Courbes ROC

Quatre situations sont habituellement issues de l’evaluation d’une methode de re-connaissance de formes (comites de reseaux de neurones ou analyse discriminante) di-chotomique (2 classes) sur un echantillon de test. En effet, le resultat de l’affectationpeut etre positif ou negatif, et la pathologie est presente (vrai) ou absente (faux). Deuxinterpretations des resultats du classifieur sont correctes (vrai positif et vrai negatif).Deux sont fausses (faux positif et faux negatif). Ces quatre situations peuvent donc etrerepresentees sous la forme d’une matrice de confusion 2× 2.

Tab. 2.2 – Matrice de confusion.

VeriteResultats de la machine Maladie presente Maladie absente

Classement vrai positif faux positifpositif a b

Classement faux negatif vrai negatifnegatif c d

Les parametres issus de la matrice de confusion permettent de calculer quatre ratiosindicateurs de la qualite de la methode de classement :

– sensibilite : pourcentage d’avoir une interpretation positive quand la pathologie estpresente : a / (a + c)

– specificite : pourcentage d’avoir une interpretation negative quand il n’y a pas depathologie : d / (b + d) ;

– valeur predictive positive : pourcentage d’avoir un cas presentant la pathologie quandl’interpretation est positive : a / (a + b) ;

– valeur predictive negative : pourcentage d’avoir un cas ne presentant pas la patho-logie quand l’interpretation est negative : d / (c + d).

La performance en % de bien classes de la methode de classement est definie par laratio suivant : (a+d)/(a+b+c+d).

Les matrices de confusion sont obtenues en fixant un seuil de risque au dela duquel lediagnostic etabli par la methode de classement pour le cas en question est juge commepathologique. Pour chaque seuil, une matrice de confusion, et donc les specificites etsensibilites associees, sont calculees.

Pour chacune des deux methodes de classement (reseaux de neurones et analyse dis-criminante), nous utilisons les specificites et sensibilites associees a chaque seuil pourensuite tracer la courbe ROC (Receiver Operator Characteristic curve) associee. Cettederniere represente la sensibilite en fonction de (1-specificite). Elle permet de regler lacapacite diagnostique des tests, en permettant au chercheur d’effectuer le compromis sou-haite entre specificite et sensibilite. L’aire sous la courbe ROC sert comme indicateur de

Chapitre 2. Aide a la decision en telecardiologie 41

la performance generale de la methode a evaluer : plus cette aire est elevee, meilleure estla methode (Figure 2.5).

Fig. 2.5 – Comparaison du pouvoir discriminant de deux methodes de classement. Selonces deux traces de courbes ROC, la methode A est meilleure que la methode B.

Resultats

Evaluation de l’interpretation des experts humains Les experts humains, cardio-logue et medecin interne, ont classe les 988 ECG d’urgence de l’ensemble de test en 4categories (D1 : infarctus confirme, D2 : probable, D3 : peu probable, D4 : pas d’infarc-tus) en tenant compte dans un premier temps uniquement de l’ECG d’urgence (analyseunaire), puis en tenant compte de l’ECG de reference (analyse serielle).

En analyse unaire, le cardiologue a classe 86 ECG dans la categorie D1 (infarctusconfirme), 371 ECG en D2 (infarctus probable), 391 ECG en D3 (infarctus peu probable)et 140 ECG en D4 (pas d’infarctus). Le medecin interne a classe a son tour 32 ECG enD1, 171 ECG en D2, 688 ECG en D3 et 97 ECG en D4.

En analyse serielle, le cardiologue a classe 80 ECG dans la categorie D1 (infarctusconfirme), 282 ECG en D2 (infarctus probable), 483 ECG en D3 (infarctus peu probable)et 143 ECG en D4 (pas d’infarctus). Le medecin interne a classe a son tour 41 ECG enD1, 174 ECG en D2, 455 ECG en D3 et 318 ECG en D4.

Le tableau 2.3 illustre les resultats de l’analyse unaire des deux experts par rapporta la verite clinique. De la meme facon, le tableau 2.4 illustre les resultats de l’analyseserielle des deux experts.

A partir des ces resultats, nous avons calcule 3 paires de sensibilite/specificite D1(infarctus confirme) contre D2+D3+D4(infarctus probable, peu probable ou pas d’in-farctus considere comme controle) ; D1+D2 (infarctus confirme ou probable considere

Chapitre 2. Aide a la decision en telecardiologie 42

comme infarctus) contre D3+D4 (infarctus peu probable ou pas d’infarctus considerecomme controle) ; D1+D2+D3 (Infarctus confirme, probable ou peu probable considerecomme infarctus) contre D4 (pas d’infarctus considere comme controle) par analyse(unaire/serielle), et nous avons utilise pour construire deux courbes ROC par expert(cardiologue/interne, figures 2.8(c) et 2.8(d)).

Pour l’analyse unaire, le cardiologue realise une sensibilite de 34% et une specificitede 97% pour D1 contre D2+D3+D4 ; 83% et 63% pour D1+D2 contre D3+D4 ; 97% et17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 13% et unespecificite de 99% pour D1 contre D2+D3+D4 ; 50% et 86% pour D1+D2 contre D3+D4 ;97% et 11% pour D1+D2+D3 contre D4.

Pour l’analyse serielle, le cardiologue realise une sensibilite de 34% et une specificitede 98% pour D1 contre D2+D3+D4 ; 78% et 73% pour D1+D2 contre D3+D4 ; 96% et17% pour D1+D2+D3 contre D4. Le medecin interne realise une sensibilite de 15% et unespecificite de 98% pour D1 contre D2+D3+D4 ; 56% et 87% pour D1+D2 contre D3+D4 ;92% et 38% pour D1+D2+D3 contre D4.

Tab. 2.3 – Resultats de l’interpretation en 4 categories (D1, D2, D3, D4) des ECG d’ur-gence de l’ensemble de test, effectuee par les deux experts, en fonction de la verite clinique(199 cas d’infarctus (AMI) et 789 cas de controle). Ce tableau illustre les resultats de l’in-terpretation unaire effectuee sur les ECG d’urgence sans avoir eu connaissance des ECGde reference des patients.

Cardiologue D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3Controles : n = 789 772 17 498 291 135 654

Infarctus (AMI) : n = 199 130 69 33 166 5 194

Sensibilite (%) - 34 - 83 - 97Specificite (%) 97 - 63 - 17 -

Medecin interne D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3Controles : n = 789 783 6 686 103 93 696

Infarctus (AMI) : n = 199 173 26 99 100 4 195

Sensibilite (%) - 13 - 50 - 97Specificite (%) 99 - 86 - 11 -

Evaluation de l’interpretation des reseaux de neurones et de l’analyse discri-minante Dans un deuxieme temps, pour chacun des deux jeux de donnees :

1. 16 parametres issus de l’ACP sur les ECG d’urgence de la base de donnees de Lund,utilises pour faire de l’analyse unaire.

Chapitre 2. Aide a la decision en telecardiologie 43

Tab. 2.4 – Meme resultats que dans le tableau 2.3, obtenus en prenant en compte uneinformation supplementaire : l’ECG de reference de chaque patient (analyse serielle)

Cardiologue D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3Controles : n = 789 778 11 583 206 136 653

Infarctus (AMI) : n = 199 130 69 43 156 7 192

Sensibilite (%) - 34 - 78 - 96Specificite (%) 98 - 73 - 17 -

Medecin interne D2+D3+D4 D1 D3+D4 D1+D2 D4 D1+D2+D3Controles : n = 789 779 10 687 102 304 485

Infarctus (AMI) : n = 199 168 31 86 113 14 185

Sensibilite (%) - 15 - 56 - 92Specificite (%) 98 - 87 - 38 -

2. 32 parametres issus de l’ACP sur les ECG d’urgence et de reference de la base dedonnees de Lund, utilises pour faire de l’analyse serielle.

j’ai effectue l’apprentissage de deux comites de reseaux de neurones et de deux modelesd’analyse discriminante avec l’ensemble d’apprentissage de 3703 patients. L’architecturedes deux comites de reseaux de neurones peut etre definie comme suit :

– Pour l’analyse unaire : un comite de 50 reseaux de neurones, avec une architectureindividuelle d’une couche cachee de 10 neurones.

– Pour l’analyse serielle : un comite de 50 reseaux de neurones, avec une architectureindividuelle d’une couche cachee de 15 neurones.

Ensuite, j’ai evalue la performance des comites de reseaux de neurones et de l’analysediscriminante sur les 988 paires d’ECG de l’ensemble de test. La sortie globale de chacundes deux comites est la moyenne des sorties individuelles des 50 reseaux sur l’ensemblede test.

Les aires sous les courbes ROC correspondant aux ensembles d’apprentissage unaireet seriel des reseaux de neurones sont respectivement de 0.92 et 0.98.

Les figures 2.6 et 2.7 illustrent les courbes ROC des 50 reseaux et de la sortie globaledes comites sur l’ensemble de test en analyse unaire et serielle.

Les deux figures montrent clairement une amelioration sensible des performances ducomite (aire sous la courbe ROC de 0.861) par rapport a chacun des reseaux individuels(meilleur reseau : aire sous la courbe ROC de 0.837), confirmant ainsi les resultats de lalitterature evoques plus haut dans la section 2.2.1. Cette augmentation des performancesest encore plus nette dans le cas de l’analyse serielle (comite : aire de 0.876, meilleurreseau : aire de 0.838). Ce qui peut etre interprete comme une application du theoreme

Chapitre 2. Aide a la decision en telecardiologie 44

central limite.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1−Spécificité

Sen

sibi

lité

Sortie individuelle de chacun des 50 réseauxSortie globale du comité, aire = 0.861

Fig. 2.6 – Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenuen analyse unaire.

Enfin, les figures 2.8(a) a 2.8(d) montrent les courbes ROC de l’ensemble des methodesde diagnostic testees dans cette section : comites de reseaux de neurones, analyse discri-minante, cardiologue et medecin interne, en analyse unaire et serielle.

En analyse unaire, les aires sous les courbes ROC sont respectivement de 0.861 pourle comite de 50 reseaux de neurones, 0.753 pour l’analyse discriminante, 0.793 pour lecardiologue et 0.713 pour le medecin interne.

En analyse serielle les performances sont sensiblement meilleures. Le comite de reseauxde neurones affiche une aire sous la courbe ROC de 0.876, l’analyse discriminante une airede 0.787, le cardiologue une aire de 0.806 et le medecin interne une aire de 0.778.

Ces resultats montrent la superiorite des reseaux de neurones par rapport a l’analysediscriminante et l’interpretation des experts humains en analyse unaire et serielle. Dememe, ils demontrent l’interet de l’analyse serielle.

Chapitre 2. Aide a la decision en telecardiologie 45

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1−Spécificité

Sen

sibi

lité

Sortie individuelle de chacun des 50 réseauxSortie globale du comité, aire = 0.876

Fig. 2.7 – Courbes ROC pour les 50 reseaux de neurones ainsi que celle du comite obtenuen analyse serielle.

2.2.3 Discussion

Il apparaıt clairement que les reseaux de neurones utilises en comite donnent demeilleurs resultats que les methodes statistiques (plus particulierement ici l’analyse dis-criminante). En effet, si l’analyse discriminante donne des resultats equivalents a ceuxd’un reseau de neurones pris individuellement, la superiorite des reseaux de neurones pro-vient de la combinaison de leurs resultats. On peut assimiler cette methode a un systememulti-experts. Le theoreme central limite montre donc son interet dans de telles situations.

La base de donnees de Lund sur laquelle nous avons travaille n’echappe pas auxproblemes inherents aux bases de donnees medicales : en effet, on peut penser qu’elle necontient pas que des cas d’infarctus aigus et des cas parfaitement sains. Au contraire,d’autres maladies sont sans doute presentes dans les ECG, mais elles ne sont pasreferencees : elles peuvent donc fausser le diagnostic du classifieur. De plus, les diag-nostics d’infarctus enregistres dans la base de donnees ont ete realises apres confirmationulterieure de l’infarctus et a partir de donnees medicales autres que l’enregistrement. Lediagnostic aurait pu etre different s’il avait ete effectue seulement a partir des ECG.Enfin, et c’est bien connu, il n’y a pas de verite en medecine : des cas classes dans lacategorie de controle pourraient en realite tres bien faire partie de la categorie des AMI etreciproquement. Les performances de nos classifieurs n’en deviennent que plus relatives.En effet, l’ECG enregistre a l’admission ne represente qu’un instantane (en fait 10 sec)

Chapitre 2. Aide a la decision en telecardiologie 46

00.

10.

20.

30.

40.

50.

60.

70.

80.

91

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.91

1−S

péci

ficité

Sensibilité

Par

amèt

res

unai

res,

aire

= 0

.861

Par

amèt

res

série

ls, a

ire =

0.8

76

(a) Comites de reseaux de neurones

00.

10.

20.

30.

40.

50.

60.

70.

80.

91

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.91

1−S

péci

ficité

SensibilitéP

aram

ètre

s un

aire

s, a

ire =

0.7

53P

aram

ètre

s sé

riels

, aire

= 0

.787

(b) Analyse discriminante

00.

10.

20.

30.

40.

50.

60.

70.

80.

91

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.91

1−S

péci

ficité

Sensibilité

EC

G c

oura

nt, a

ire =

0.7

93E

CG

de

réfé

renc

e +

EC

G c

oura

nt, a

ire =

0.8

06

(c) Cardiologue

00.

10.

20.

30.

40.

50.

60.

70.

80.

91

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.91

1−S

péci

ficité

Sensibilité

EC

G c

oura

nt, a

ire =

0.7

13E

CG

de

réfé

renc

e +

EC

G c

oura

nt, a

ire =

0.7

78

(d) Medecin interne

Fig. 2.8 – Comparaison des courbes ROC des differentes methodes en analyse unaire etserielle.

Chapitre 2. Aide a la decision en telecardiologie 47

de la vie du patient. Une ischemie presente a cet instant peut tres bien se resorber touteseule et ne pas provoquer une montee enzymatique ou au contraire, l’ECG a l’admis-sion peut etre tout a fait normal et un infarctus aigu peut se developper une demi heureapres. En fait, il faudrait enregistrer l’ECG en continu et le correler minute par minute oumeme seconde par seconde avec des explorations quantitatives de l’etat du myocarde tellesque mesure continue des enzymes, imagerie continue par IRM. . . impossible a realiser enroutine clinique.

Neanmoins, les resultats obtenus dans cette base de donnees de taille relativement im-portante montrent bien l’importance de la variabilite inter-observateurs de l’interpretationhumaine, meme en disposant d’un trace de reference, et de l’aide au diagnostic qui doitetre apportee, meme a un cardiologue confirme. Comme relate recemment par Bates etal [93], notre etude renforce de facon significative l’interet d’utiliser les technologies del’information pour ameliorer la precision diagnostique. A titre d’illustration, pour unespecificite de 90%, la meilleure sensibilite de l’interpretation humaine est de 52% alorsque la sensibilite de notre comite de reseaux de neurones atteint 67%, d’ou un gain de15%.

Les perspectives d’optimisation et d’amelioration de notre methode de classement parreseaux de neurones sont nombreuses :

– Une premiere piste d’amelioration est liee aux reseaux de neurones : optimisationde l’architecture, du parametrage initial precedant l’apprentissage, de l’algorithmed’apprentissage, de la combinaison des sorties individuelles des reseaux composantsle comite, etc.

– Architecture du reseau. Il faut savoir que notre objectif etait d’evaluer la robus-tesse des reseaux de neurones. Nous avons pour cela utilise une configurationdeterminee dans [22]. Cependant, un travail d’optimisation doit etre fait pourdeterminer l’architecture la plus adaptee a ce type de problemes, c’est a direl’interpretation automatique des ECG. Dans la litterature, de nombreux tra-vaux de recherche ont permis de developper des methodes de reconstructionautomatique de l’architecture des reseaux de neurones moyennant des algo-rithmes genetiques [94].

– Parametrage initial pre-apprentissage. Dans notre application, nous avonschoisi pour chaque reseau individuel un parametrage initial aleatoire des poids.Si cette approche reste la plus simple et la plus souvent utilisee dans lalitterature, de nouvelles strategies privilegiant une selection ciblee du pa-rametrage initial des reseaux ont commence a prouver leur efficacite a ameliorerla performance des reseaux de neurones [95, 96].

– Une deuxieme piste d’amelioration est liee a l’utilisation d’informationssupplementaires, en plus de l’ECG, tels que les donnees cliniques, l’historiquemedical, etc. de maniere a etablir un diagnostic plus personnalise et plus adapte.Cette approche est decrite dans la deuxieme partie de ce chapitre.

Chapitre 2. Aide a la decision en telecardiologie 48

Conclusion

Actuellement, de nombreux travaux de recherche tentent de developper de nouvellesapproches d’aide a la decision, dans le but de realiser des systemes intelligents qui tiennentcompte de la specificite de l’utilisateur.

Le cas concret sur lequel nous avons travaille relevait du domaine de l’electrocardiologiequantitative et de l’interpretation automatique des ECG. Nous avons tout d’abord pro-pose un modele original de traitement des donnees, puis nous nous sommes plus parti-culierement interesses a la detection des ischemies. Les resultats obtenus montrent l’interetde l’utilisation de comites de reseaux de neurones par rapport a des methodes statistiques(plus particulierement l’analyse discriminante). Le theoreme central limite a montre sapuissance : il permet d’augmenter considerablement les performances des reseaux de neu-rones pris individuellement.

Quoiqu’il en soit, il n’existe certainement pas de methode universelle pour l’aide a ladecision, mais il va falloir au contraire proceder par fusion de classifieurs et par fusionde donnees en integrant davantage d’information (donnees cliniques, historique medical,etc.) dans le processus decisionnel.

2.3 Quantification du risque cardiovasculaire par ap-

proche probabiliste

Le systeme de decision embarque dans le PEM pour la detection des ischemies estdans sa version actuelle base sur l’utilisation de comites de reseaux de neurones artificielsavec une generation d’alarmes et de leur niveau prenant en consideration les scores derisque evalues par les reseaux de neurones.

Cependant, pour obtenir un diagnostic plus precis et plus personnalise, nous avonsenvisage une deuxieme approche qui consiste a inclure dans le processus decisionnel unestratification des informations cliniques du patient telles que les facteurs de risque. Lefait d’ajouter une information supplementaire dans la decision finale devrait permettred’avoir une marge de securite supplementaire.

A titre d’exemple, si pour un sujet sain de 45 ans sans antecedents cardiaques, lemodule d’interpretation neuronal etablit un score diagnostic qui correspond a une alarmed’importance majeure, il est probable que l’acquisition de l’ECG PEM ne se soit pasderoulee correctement (position pendant l’enregistrement, electrodes mal placees. . . ). Parcontre, si dans la famille il y a eu des antecedents d’infarctus avant 50 ans, il se pourraitque l’on soit en presence d’une ischemie et il faudrait demander l’avis d’un cardiologue etdonc suggerer a l’utilisateur de transmettre l’ECG a son medecin traitant ou a un centre

Chapitre 2. Aide a la decision en telecardiologie 49

de competences. D’ou l’interet de tenir compte des facteurs de risque de la personneutilisatrice du PEM pour revoir a la hausse ou a la baisse le score de risque et l’alarmeassociee.

La figure 2.9 illustre l’evolution du processus decisionnel que nous preconisons demettre en place dans le PEM. La version actuellement embarquee dans le PEM consiste enun module neuronal qui analyse l’ECG et en fonction du score de risque declenche l’alarmemajeure, moyenne, mineure voire aucune alarme. La nouvelle version devrait inclure enplus du module neuronal, un module de stratification des facteurs de risque que nousallons decrire dans le reste de cette section. Ce module intervient apres l’interpretationde l’ECG PEM, lorsque l’ECG est juge comme suspect (ce qui correspond a une alarmemoyenne ou mineure) soit pour confirmer le niveau d’alarme, soit le modifier en fonctiondes facteurs de risque du sujet.

Fig. 2.9 – Schema synoptique du processus decisonnel embarque dans le PEM : a) sa ver-sion actuelle ; b) une future version que nous proposons avec l’introduction d’un deuxiemescore de risque base sur le dossier medical du patient.

Chapitre 2. Aide a la decision en telecardiologie 50

2.3.1 Choix methodologiques

Pour fusionner des donnees quantitatives (taux de cholesterol, parametres ECG. . . ) etqualitatives (historique medical du patient) dans un seul et unique procede de decision,differentes approches existent.

Approche heuristique

La premiere approche, qui a ete abordee dans le cadre d’EPI-MEDICS, a consiste aconcevoir un systeme a base de regles, sous forme d’algorithmes (Figure 2.10). Ces reglesont ete elaborees a partir de directives et recommandations de comites d’experts de santepublique en general et de cardiologie en particulier.

Fig. 2.10 – Illustration d’algorithmes de stratification du risque cardiovasculairedeveloppes dans le cadre d’EPI-MEDICS.

A titre d’exemple l’algorithme A2 calcule pour les sujets sains la probabilite d’uneatherosclerose coronarienne en se basant sur la douleur thoracique en tant qu’informationde base. Il s’agit du modele probabiliste etabli par Diamond et al [97]. Ce modele est basesur trois types de douleur (douleur non-angineuse, douleur typique d’angine de poitrineou douleur d’angine de poitrine atypique), sur quatre classes d’age (30-39, 40-49, 50-59,60-69) et sur le sexe. Pour chaque variable, un score est donne (tableau 2.5) et le risqued’une maladie coronaire est donne en fonction du total des points.

En fait ces algorithmes n’ont pas vraiment ete implementes dans le PEM car meme sil’on sait calculer, a partir de ces regles, des facteurs (score/index) de risque, aucun expertn’a ete capable d’indiquer concretement comment combiner ces scores avec l’interpretationdes ECG pour moduler le degre d’alarme.

Chapitre 2. Aide a la decision en telecardiologie 51

Tab. 2.5 – Scores de risque en pourcentage de la survenue d’une maladie coronaire enfonction de l’age, du sexe et des caracteristiques de la douleur de thoracique. D’apresDiamond et Forrester, N Engl J Med 1979.

douleur non-angineuse douleur atypique d’angine douleur typique d’angineAge H F Age H F Age H F30-39 5.2 0.8 30-39 21.8 4.2 30-39 69.7 25.840-49 14.1 2.8 40-49 46.1 13.3 40-49 87.3 55.250-59 21.5 8.4 50-59 58.9 32.4 50-59 92.0 79.460-69 28.1 18.6 60-69 67.1 54.4 60-69 94.3 90.6

Approche probabiliste

L’autre approche consiste a utiliser des methodes d’intelligence artificielle pourdevelopper des modeles de quantification du risque cardiovasculaire a partir des connais-sances medicales et des bases de donnees cliniques. Notre objectif est d’utiliser la methodequi pallie au mieux les problemes specifiques poses par notre application : prendre desdecisions basees sur des donnees incompletes et de natures differentes et expliquer le rai-sonnement en fonction des resultats. C’est pour ces raisons que nous avons choisi uneapproche probabiliste basee sur l’utilisation des reseaux bayesiens pour realiser notre mo-dule de facteurs de risque.

En effet, selon le type d’application, l’utilisation des reseaux bayesiens peut etre envi-sagee au meme titre que celle d’autres modeles : reseaux de neurones, systemes experts,arbres de decision, etc. Les aspects suivants des reseaux bayesiens les rendent, dans denombreux cas, preferables aux autres modeles :

– Acquisition des connaissances : Les reseaux bayesiens donnent la possibilite de ras-sembler et de fusionner des connaissances de diverses natures dans un meme modele.

– Representation des connaissances : La representation graphique d’un reseau bayesienest explicite, intuitive et comprehensible par un nonspecialiste, ce qui facilite a lafois la validation du modele, ses evolutions eventuelles et surtout son utilisation.Typiquement, un decideur est beaucoup plus enclin a s’appuyer sur un modele dontil comprend le fonctionnement qu’a faire confiance a une modele ”Boıte noire”.

– Utilisation des connaissances : Un reseau bayesien est polyvalent, i.e. on peut se ser-vir du meme modele pour evaluer, prevoir, diagnostiquer, ou optimiser des decisions,ce qui contribue a rentabiliser l’effort de construction du reseau bayesien.

Enfin, l’interet de l’approche des reseaux bayesiens [55] par rapport a d’autres tech-niques d’intelligence artificielle telles que les reseaux de neurones. . . est justifie par leurcapacite a modeliser l’incertitude inherente au raisonnement medical et a prendre desdecisions basees sur des donnees incompletes et de natures differentes (discrete, continue)[98]. Les applications cliniques mettant en œuvre l’utilisation les reseaux bayesiens sont

Chapitre 2. Aide a la decision en telecardiologie 52

variables : de l’aide au diagnostic a l’imagerie et au traitement du signal, en passant parl’analyse de donnees, etc. [99, 100, 101, 102].

Dans le reste de cette section, nous allons presenter les reseaux bayesiens et leur miseen œuvre sur une base de donnees clinique : la base de donnees INDANA [103]. Cettebase de donnees reunit des donnees medicales individuelles (age, sexe, cholesterol. . . ) depatients presentant une hypertension arterielle avec un suivi sur 7 ans et l’enregistrementde la survenue ou de la non survenue des evenements cardiovasculaires suivants : infarctus,accident vasculaire cerebral (AVC), mort d’origine cardiovasculaire. Nous entraınerons lereseau bayesien a utiliser ces donnees pour predire le risque cardio-vasculaire, et nous com-parerons ses performances par rapport a deux autres methodes utilisees comme temoin :les reseaux de neurones, et l’analyse discriminante.

2.3.2 Les reseaux bayesiens

Les reseaux bayesiens [50] font partie de la famille des modeles graphiques qui re-groupent entre autres : les modeles de Markov caches, les filtres de Kalman, etc. Cesmodeles sont le mariage entre la theorie des probabilites et celle des graphes. Dans cettesection, nous allons commencer par presenter quelques principes et concepts de base desmodeles graphiques. Ensuite nous allons nous focaliser sur un modele particulier de lafamille des modeles graphiques : les reseaux bayesiens en termes de structure, parametreset inference.

Terminologie

Un modele graphique est un outil utilise pour illustrer visuellement (theorie desgraphes) et representer de facon factorisee une distribution conjointe de probabilites sur unensemble de variables d’un probleme donne (theorie des probabilites) [104]. Un graphe estcompose d’une serie de nœuds1, representant les variables et evenements du monde reel,connectes par des aretes, representant les interactions entre les nœuds, qui peuvent etreorientees. Dans ce dernier cas, nous pouvons parler de graphe oriente (Directed Graph,DG).

Une chaıne est une serie de nœuds telle que chacun de ces nœuds est connecte a sonpredecesseur via une arete. Un chemin est une chaıne telle que chaque arete est orienteedans la meme direction que la chaıne. Un cycle est un chemin qui commence et se termineau meme nœud. Un chemin est dit simple si et seulement si chaque nœud est visiteune seule fois. Un cycle est dit simple si, et seulement si, tous ses nœuds sont uniques al’exception du nœud de depart et de celui d’arrivee. Un graphe acyclique oriente (DirectedAcyclic Graph : DAG) est un graphe oriente qui n’a pas de cycles.

1Dans la suite du rapport, les termes nœuds et variables seront employes de facon interchangeable

Chapitre 2. Aide a la decision en telecardiologie 53

Dans un DAG, une arete lie un nœud, intitule parent, a un autre nœud, intitule enfant.Si X1 est le parent de X2 et X2 est le parent de X3, alors X1 est un ancetre de X3 etX3 est a son tour un descendant de X1. Une famille est formee d’un nœud X et de sesparents.

Une foret est un DAG tel que chaque nœud a au plus un parent. Un arbre est uneforet ou chaque nœud a un parent et un seul sauf la racine de l’arbre. Une corde est unearete connectant deux nœuds non-consecutifs. Un graphe triangule est un DAG ou tousles cycles de longueur ≥ 3 ont forcement une corde.

Le terme complet decrit un graphe non-oriente ou chaque nœud est connecte au restedes nœuds du graphe. Un cluster est simplement un sous-groupe de nœuds dans un graphe.Une clique est le plus grand ensemble de nœuds, connectes deux a deux : il s’agit d’unsous-graphe complet.

Generalites

Un reseau bayesien est une version particuliere de modeles graphiques representee sousforme d’un DAG dont les nœuds incarnent les objets et evenements du monde reel. Lesrelations cause a effet entre les nœuds sont representees par des aretes orientees du nœudcause vers le nœud effet (Figure 2.11).

Chaque nœud a une distribution de probabilite conditionnelle P(Xi|Parents(Xi)) quiquantifie l’effet du parent sur le nœud. Une probabilite a priori est affectee aux nœudsracines (sans parents).

Fig. 2.11 – Reseau bayesien simple

La specification probabiliste du reseau bayesien passe par la representation d’une dis-tribution de probabilite conjointe pour tous ses nœuds. Cette distribution conjointe estdefini comme le produit des distributions conditionnelles locales :

P (X1 . . . , Xn) =N∏

i=1

P (Xi|Pa(Xi)) (2.4)

ou Pa(Xi) designe l’ensemble des parents du nœud Xi.

Chapitre 2. Aide a la decision en telecardiologie 54

A partir des probabilites conditionnelles, de la structure du reseau et de la distributionde la probabilite conjointe, nous pourrons alors calculer la probabilite a posteriori qu’unnœud prend tel ou tel etat. La probabilite a posteriori P (X|Y ) etant donnee la probabilitea priori P (X) et la probabilite conditionnelle P (Y |X) de Y sachant que X est vrai (true)est donnee par la theoreme de Bayes comme suit :

P (X|Y ) =P (Y |X)P (X)

P (Y )(2.5)

Pour configurer un reseau bayesien, il est necessaire de specifier les Distributions desProbabilites Conditionnelles (CPD) pour tous les nœuds ayant des parents et la probabilitea priori des nœuds racines.

Inference et arbre de jonction

Par definition, l’inference consiste a calculer la probabilite de chaque etat d’un nœuddans un reseau bayesien, quand d’autres nœuds sont observes. Plusieurs algorithmes ontete proposes pour realiser l’inference. Le plus repandu est l’algorithme de l’arbre de jonc-tion [105, 106, 107].

Fonctionnement L’algorithme de l’arbre de jonction est un processus a trois etapes :transformation, propagation et marginalisation.

1. l’etape de transformation consiste a construire un arbre de jonction a partir dureseau bayesien

2. l’etape de propagation, comme son nom l’indique, consiste a propager le vecteur desvaleurs de nœuds observes puis a realiser l’inference sur l’arbre de jonction

3. l’etape de marginalisation consiste a marginaliser les variables non-observees dureseau.

Nous allons illustrer la maniere dont l’algorithme procede en reprenant le memeexemple que dans [55] : il s’agit d’un reseau bayesien modelisant le comportement dumarche boursier (indice boursier en hausse, en baisse, voire effondre). Ce comportementest estime par rapport au bug de l’an 2000 et est sense modeliser ses repercussions surle secteur electrique, les reseaux de telecommunications, les transports, le service publicet le secteur financier (banques) (Figure 2.12). Les rapports d’influence sont indiques atravers les liens orientes (cause a effet) entre les diverses variables du reseau. A noter qu’ilne s’agit que d’une representation simplifiee d’un cas reel beaucoup plus complexe et danslequel de nombreux facteurs entrent en jeu.

Transformation en arbre de jonction

Chapitre 2. Aide a la decision en telecardiologie 55

Fig. 2.12 – Reseau bayesien ”bug an 2000”.

– Moralisation : la moralisation d’un graphe consiste a connecter les parents des nœudsdeux a deux et a enlever l’orientation des aretes. La moralisation de notre reseauengendre la creation de 3 aretes supplementaires Rail-Transport aerien, Transports-Service public et Transports-Banques (Figure 2.13).

Fig. 2.13 – Meme graphe que Figure 2.12 apres moralisation.

– Triangulation : Un graphe non-oriente est triangule si tous les cycles de plusde 3 nœuds ont une corde. La triangulation est realisee a travers un processusd’elimination2 de nœuds comme suit :

1. pour i=1 a N (N designe le nombre de nœuds)

(a) selectionner le nœud qui engendre l’ajout d’un minimum d’aretes lorsqu’ilest supprime. Si nous avons le choix entre plusieurs, alors il faut choisir

2L’elimination d’un nœud u dans un graphe non-oriente consiste a d’abord connecter tous ses nœudsvoisins deux a deux et ensuite a supprimer le nœud u et toutes les aretes connectees a ce nœud

Chapitre 2. Aide a la decision en telecardiologie 56

celui qui induit le cluster ayant le plus petit poids3

(b) connecter tous les nœuds du cluster induit par le nœud selectionne

(c) retenir le cluster induit s’il n’est pas un sous-ensemble d’un des clustersretenus au cours des iterations precedentes

(d) supprimer le nœud selectionne du graphe

2. modifier le graphe initial en ajoutant les aretes que nous venons de creer.

La figure 2.14 presente le reseau bayesien moralise et triangularise.

Fig. 2.14 – Meme graphe que Figure 2.12 apres triangulation.

– Construction de l’arbre de jonction : Les clusters retenus (tableau 2.6) du processusde triangulation constituent a leur tour les nœuds de l’arbre de jonction. Le problemereside alors dans la maniere de les connecter afin de satisfaire la definition d’un arbrede jonction. Cela peut etre effectue via l’algorithme cite dans [55] comme suit :

1. creer n arbres, chacun contenant une seule clique.

2. pour chaque paire de cliques A et B : creer un separateur, SAB, contenantl’intersection A ∩B

3. recommencer le processus jusqu’a ce que n-1 separateurs soient crees et inseresdans la foret, ensuite

(a) selectionner et enlever le separateur SAB ayant la plus grande masse4 dela liste des separateurs. Si deux separateurs ont une meme masse, alors ilfaut supprimer celui qui a le plus petit cout5

3La notion de poids est definie comme suit :

– le poids d’un nœud est defini comme le nombre d’etats que ce nœud peut prendre

– le poids d’un cluster est le produit des poids de ses nœuds

4La masse d’un separateur est le nombre de variables qu’il contient5Le cout d’un separateur SAB est le poids de A plus le poids de B

Chapitre 2. Aide a la decision en telecardiologie 57

Tab. 2.6 – Illustration du deroulement de l’algorithme de triangulation. Les clustersretenus pour l’arbre de jonction sont marques par une etoile (*).

Aretes Aretes ClusterEtape eliminees ajoutees induit

1 Bourse - Banques, Service public, Transports,Bourse*

2 Telecom Electricite-Banques Electricite, Banques, Service public,Telecom*

3 Transport aerien Electricite-Transports Electricite, Transports, Rail,Transport aerien*

4 Rail - Electricite, Transports, Rail5 Electricite - Service public, Banques, Transports,

Electricite*6 Transports - Banques, Service public, Transports7 Banques - Service public, Banques8 Service public - Service public

(b) si deux cliques A et B se trouvent dans deux arbres distincts de la foret,alors il faut les connecter en inserant SAB entre eux, ce qui signifie la fusiondes deux arbres

4. l’arbre final obtenu represente l’arbre de jonction souhaite (Figure 2.15).

Initialisation du reseau

Lorsque l’arbre de jonction est pret, l’etape suivante consiste a l’initialiser en affectantdes fonctions de potentiels6 a ses nœuds comme suit :

1. pour chaque cluster et separateur, initialiser le potentiel a 1φA ← 1

2. pour chaque nœud u, attribuer un cluster A contenant la famille de u (u et sesparents). Ensuite, inserer la probabilite conditionnelle P (Xu|Xpa(u)) dans φA commesuit :

φA ← φA.P (Xu|Xpa(u))

Propagation et marginalisation La marginalisation des nœuds du reseau bayesiense fait a travers un algorithme de propagation globale qui consiste a passer un message(information nouvelle) d’une clique a une autre, filtre a travers les separateurs entre cescliques. Un passage de message (message passing) entre deux clusters A et B consiste a :

6Un potentiel φA sur un ensemble de variables Xa est une fonction qui prend l’ensemble des affectationspossibles des valeurs des variables de Xa et rend une valeur dans l’intervalle [0,∞[

Chapitre 2. Aide a la decision en telecardiologie 58

Fig. 2.15 – L’arbre de jonction obtenu a partir du reseau bayesien avec les clusters retenusdu processus de triangulation (ovales) et les separateurs induits (carres).

– passer le message du cluster A vers le separateur SAB, ce qui implique la mise ajour du potentiel du separateurSAB : φSancien

AB← φSAB

φSAB← ΣA|SAB

φA

– passer le message du separateur SAB vers le cluster B, soit :

φB ← φancienB

φSAB

φSancien

AB

Introduction d’observations L’observation (evidence) est representee sous formed’une fonction de vraisemblance (likelihood) d’une variable Xu notee λXu(xu) qui estcalculee comme suit :

– lorsque la variable Xu est observee, la fonction de vraisemblance est :

λXu(xu) = {1 lorsque xu est l’etat observe de Xu

0 dans le cas contraire(2.6)

– lorsque Xu n’est pas observe, la fonction de vraisemblance est une constante,λXu(xu) ← 1

n, pour les n etats xu de Xu.

Lorsqu’une observation (Xu = xu) est entree dans le reseau, la mise a jour des fonctionsde vraisemblance se fait de la maniere suivante :

Chapitre 2. Aide a la decision en telecardiologie 59

– codage de l’observation sous forme de fonction de vraisemblance λnouvelleXu

– identification du cluster A contenant u et mise a jour de φA et λXu comme suit :

1. φA ← φAλnouvelleXu

2. λXu ← λnouvelleXu

2.3.3 Apprentissage des reseaux bayesiens

L’apprentissage d’un reseau bayesien doit permettre d’estimer les probabilites condi-tionnelles de chaque nœud du reseau a partir d’un echantillon de donnees.

Cas de donnees completes

Dans le cas ou toutes les variables sont observees, la methode la plus simple et la plusutilisee est l’estimation statistique qui consiste a estimer la probabilite d’un evenementpar la frequence d’apparition de l’evenement dans la base de donnees. Cette approche,appelee maximum de vraisemblance (MV), nous donne alors :

P (Xi = xk|parent(Xi) = cj) = θi,j,k =Ni,j,k

ΣkNi,j,k

(2.7)

ou, Ni,j,k est le nombre d’evenements dans la base de donnees pour lesquels la variableXi est dans l’etat xk et ses parents sont dans la configuration cj.

Cas de donnees incompletes

Dans les applications pratiques, les bases de donnees sont tres souvent incompletes.Certaines variables ne sont observees que partiellement ou meme jamais. La methoded’estimation de parametres avec des donnees incompletes la plus couramment utilisee estfondee sur l’algorithme iteratif EM (Expectation - Maximisation) [108, 109]. Il s’agit d’unemethode generale d’optimisation qui peut etre appliquee dans certains cas de maximumde vraisemblance (Maximum Likelihood) d’estimation des parametres comme suit :

θ∗ = arg maxθ

P(X = x|θ, M) (2.8)

ou θ est un vecteur de parametres, X est une variable aleatoire ayant x comme valeursobservees, et M est le modele (reseau bayesien,. . . ).

Chapitre 2. Aide a la decision en telecardiologie 60

Deroulement L’algorithme E.M. est base sur une decomposition du probleme d’opti-misation grace a l’introduction d’une variable aleatoire z dite cachee dans le modele cequi rend le probleme d’optimisation analytiquement faisable.

Toutefois, au lieu d’essayer de maximiser la vraisemblance des donnees observeesP (X|θ), nous allons maximiser la vraisemblance de la distribution jointe de X et Z ={zi}N

1 (N designe le nombre de classes), P (X, Z|θ). Nous allons utiliser le logarithme decette formule, log(P (X, Z|θ)). En plus, puisque nous ne pouvons pas connaıtre les valeursdes variables aleatoires zi, nous utilisons l’esperance (expectation) de cette quantite, soitune distribution quelconque Q(Z). L’algorithme E.M. consiste en deux etapes (E-step etM-step) qui seront executees a chaque iteration comme suit :

E-step Elle consiste a calculer la valeur esperee (expected value) du log-probabilitede la distribution jointe de X et Z comme suit :

Q(θ, θk) = EZ [log(P (X, Z|θ,M))|X = x, θk] (2.9)

M-step Au cours de cette etape les parametres θ sont mis a jour comme suit :

θk+1 = arg maxθ

Q(θ, θk) (2.10)

θk designe la serie des valeurs des parametres obtenues a la keme iteration de l’algorithme.

Ces deux etapes seront repetees jusqu’a ce que l’algorithme converge vers un maxi-mum : tant que |θk − θk−1| ≤ ε.

2.3.4 Configuration du modele probabiliste de stratification durisque cardiovasculaire

L’objectif est realiser un outil de prediction individualisee du risque cardio-vasculaire,en vue de le combiner avec le modele de reseaux de neurones. Nous posons le probleme dela prediction du risque cardio-vasculaire comme un probleme d’apprentissage supervisea partir de donnees de suivi de populations a risque, dans lequel l’evenement a predireest represente par deux ”classes”, survenue ou non survenue d’un evenement cardiaque(infarctus, accident vasculaire cerebral, mort d’origine cardiovasculaire). Pour realiser cetobjectif nous avons utilise la base de donnees INDANA [103] que nous presentons rapi-dement ci-apres. Puis nous decrivons la structure du reseau bayesien dont nous evaluonsles performances en reference a un modele neuronal et d’analyse discriminante.

Chapitre 2. Aide a la decision en telecardiologie 61

2.3.5 La base de donnees INDANA

La base de donnees INDANA [103] reunit les donnees individuelles de 10 essaistherapeutiques randomises et conduits pour evaluer dans le temps l’efficacite de traite-ments anti-hypertenseurs. Les sujets faisant partie de cette base de donnees ont ete suivis,en moyenne, sur une periode de 5 ans durant laquelle toute incidence d’evenements denature cardiovasculaire a ete relevee : accident vasculaire cerebral, infarctus du myocarde,deces par accident vasculaire cerebral, deces par infarctus du myocarde. La survenue d’unevenement cardiovasculaire est code 1, l’absence d’evenement est code 0 (cas controle).

Pour chaque patient, la base de donnees contient, au minium, des donneesdemographiques, medicales et cliniques enregistrees au debut du suivi : age, sexe, pres-sion arterielle systolique et diastolique, indice de masse corporelle, etc., ainsi que lesantecedents d’infarctus du myocarde, d’accident vasculaire cerebral, de diabete et de trai-tement antihypertenseur.

Parmi ces variables, nous en avons retenu 13 pour leur pertinence vis a vis de lastratification du risque cardiovasculaire. Elles sont listees dans la table 2.7.

Tab. 2.7 – Variables retenues pour realiser les modeles de stratification : reseau bayesien,comite de reseau de neurones et analyse discriminante.

Variable Type

Age continu

Pression arterielle systolique continu

Pression arterielle diastolique continu

Indice de masse corporelle continu

Cholesterolemie totale continu

Taux de glucose sanguin continu

Sexe discret

Hypertrophie ventriculaire gauche discret

Antecedent d’infarctus de myocarde discret

Antecedent d’accident vasculaire cerebral discret

Antecedent de diabete discret

Antecedent de traitement antihypertenseur discret

Tabagisme discret

Evenement cardiovasculaire discret

Enfin, la base de donnees INDANA a ete divisee de facon aleatoire en 2 sous-ensemblesafin d’obtenir un ensemble d’apprentissage de 15013 cas pour la configuration du reseaubayesien et un ensemble de test de 5004 sujets pour evaluer la performance du reseaubayesien. Les memes ensembles d’apprentissage et de test ont ensuite ete utilises pour

Chapitre 2. Aide a la decision en telecardiologie 62

entraıner et tester le modele d’analyse discriminante et un comite de reseaux de neurones.

2.3.6 Realisation du reseau bayesien

Un reseau bayesien est un modele probabiliste causal. En d’autres termes, les variablessont liees par un lien de cause a effet : predecesseurs et successeurs. Pour cette raison,le choix d’une structure modelisant le probleme en question est crucial. Meme, si desalgorithmes d’apprentissage de structures ont ete developpes, l’approche manuelle restela plus fiable et la plus souvent adoptee.

La structure du reseau bayesien a ete determinee de facon manuelle en se basant sur lesconnaissances theoriques [9, 11, 110] et le savoir-faire des experts du domaine, notammentavec l’aide du docteur Gueyffier de l’Hopital Cardiologique de Lyon. En effet une serie dereunions avec le docteur Gueyffier m’a permis :

– D’abord d’etudier et analyser la base de donnees INDANA afin d’extraire les va-riables qui pourraient servir dans l’elaboration du modele de stratification du risquecardiovasculaire.

– Ensuite, de determiner les influences en termes de liens de cause-a-effet entre lesdiverses variables du modele.

– Enfin, de tester divers configurations de reseaux bayesiens. Ces configurations sontdeterminees en fonction du nombre de variables utilisees et les liens causaux entreces variables.

A noter que nous aurions pu adopter une des diverses approches de recueil de connais-sances utilises surtout dans l’elaboration des systemes experts et des systemes de ges-tion de bases de connaissances : les outils et methodes proposes pour aider au transfertd’expertise (KADS [111], KOD [112],. . . voire ceux permettant d’apprendre de nouvellesconnaissances a partir d’exemples [113, 114]. Mais du fait qu’il ne s’agit que d’un premieressai pour evaluer la faisabilite d’une telle approche, a savoir les reseaux bayesiens, j’aiopte pour une simple collaboration avec le cardiologue.

La figure 2.16 illustre le reseau bayesien que nous avons utilise pour stratifier lesfacteurs de risque. Ce reseau prend en entree les donnees cliniques, demographiques, l’his-torique medical, etc. du patient et donne une estimation du risque de la survenue d’unevenement cardiovasculaire.

Enfin, pour creer notre modele de reseau bayesien, nous avons utilise le logicielBayesialabTM.

Chapitre 2. Aide a la decision en telecardiologie 63

Fig. 2.16 – Reseau bayesien utilise pour estimer le risque cardiovasculaire.

Realisation du comite de reseaux de neurones

Notre objectif etant uniquement d’evaluer la robustesse du reseau bayesien par rapporta un temoin, nous avons choisi de l’evaluer par rapport a un comite de 50 reseaux deneurones que nous avons configure comme suit :

– Apprentissage : l’apprentissage est realise comme pour l’interpretation des ECGen nous basant sur la methode de Levenberg-Marquardt [87, 88]. Pour eviter lephenomene de sur-apprentissage, nous avons utilise la methode d’arret precoce (earlystopping), deja decrite dans la section 2.2.1.

– Fonctions d’activation : comme nous voulons avoir en sortie du reseau des valeurscomprises entre 0 et 1, nous utilisons par 2 fois des fonctions logarithme-sigmoıde.

– Architecture neuronale : le choix d’une seule couche cachee avec 10 neurones sur lacouche cachee semble etre un bon compromis entre la complexite (et donc le tempsde calcul) et la performance du reseau (Figure 2.17).

Le modele de reseaux de neurones a ete realise avec MatlabTM et la boite a outils”reseaux de neurones” de Matlab.

Chapitre 2. Aide a la decision en telecardiologie 64

Fig. 2.17 – Illustration de la structure individuelle des reseaux de neurones utilises pourestimer le risque cardiovasculaire.

2.3.7 Resultats

Les trois methodes de stratification du risque cardiovasculaire ont ete evaluees surl’ensemble de test de 5004 cas extrait de la base de donnees INDANA en comparant lescourbes ROC. L’evaluation a montre une large superiorite de l’approche bayesienne, avecune aire sous la courbe ROC de 0.80 contre 0.75 pour le comite de reseaux de neuroneset 0.74 pour le modele d’analyse discriminante.

2.3.8 Discussion

Le choix d’un raisonnement probabiliste a base de reseaux bayesiens est justifie pourdeux raisons :

– la portabilite : le modele peut etre facilement etendu a d’autres maladies cardiovas-culaires. Rappelons que le PEM est a la base configure pour detecter les arythmieset l’ischemie.

– la simplicite : Au dela de l’apprentissage automatique en termes de probabilitesconditionnelles et a priori des facteurs de risque, le fait qu’il s’agit d’un modeleprobabiliste graphique permet d’envisager que le medecin traitant de l’utilisateurdu PEM puisse regler les parametres du reseau (probabilites a priori, liens cause-effet. . . ) de maniere a affecter d’un poids plus important un facteur de risquespecifique au patient.

Chapitre 2. Aide a la decision en telecardiologie 65

2.3.9 Conclusion

Le modele propose n’est qu’un prototype qui permet d’etablir une prediction individua-lisee du risque cardio-vasculaire chez des patients presentant une hypertension arterielle[115]. Cela signifie que pour une population plus large, d’autres facteurs que le modelen’a pas pris en consideration, pourraient influencer la survenue d’une maladie cardiaque.De meme, l’impact des facteurs en termes de liens cause-effet pourrait etre different. Laprochaine etape serait donc d’evaluer le modele sur d’autres bases de donnees, voire deconfigurer plusieurs variantes du modele qui seraient adaptees a une serie de profils typesde l’utilisateur du PEM.

2.4 Vers un modele multi-classifieurs multi-modules

du diagnostic de l’infarctus : Interaction du mo-

dule neuronal et du module bayesien dans le pro-

cessus decisionnel global

L’utilisation du module neuronal d’interpretation de l’ECG avec des seuils de risquereglables en fonction de la personne utilisatrice du PEM devrait permettre d’ameliorer lasensibilite de detection d’une ischemie. Cependant, il y a un interet capital a reduire le tauxdes faux-negatifs tout en maintenant une sensibilite optimale. Cela n’est pas realisablesans l’introduction du module bayesien avec une interaction suffisamment souple entre lesdeux modules. C’est la raison pour laquelle l’etape finale dans la realisation du moduledecisionnel du PEM devrait etre l’introduction d’une couche logicielle pilote qui va gererl’interaction entre les modules et emettre l’alarme la plus appropriee. Il s’agit d’un systemea base de regles traitant tous les cas de figures possibles. Pour realiser ce systeme, on peututiliser une approche classique de regles basee soit sur la logique booleenne soit sur lalogique dite ”floue”.

Dans le PEM, nous envisageons de concevoir un systeme a base de regles floues [116,117, 118]. Le choix d’une telle technologie est lie au fait que la logique floue permetd’introduire une graduation dans des notions auparavant soit vraies soit fausses. En effet,s’appuyant sur la theorie mathematique des sous-ensembles flous qui est une extension dela theorie des ensembles classiques pour la prise en compte d’ensembles definis de faconimprecise, la logique floue est utilisee dans des domaines aussi varies que l’automatisme, larobotique, l’environnement, la medecine (aide au diagnostic), etc. L’interet de la logiquefloue est d’assurer que les differentes methodes de diagnostic ne soient pas en competition,mais au contraire, on cherchera a utiliser leur complementarite pour ameliorer le processusdecisionnel. Dans la suite de cette section, nous presentons brievement la logique floue,son interet, ses concepts et un exemple de mise en œuvre d’applications de regles floues,ainsi que ce qui pourrait etre le scenario decisionnel global dans le PEM apres deploiement

Chapitre 2. Aide a la decision en telecardiologie 66

des modules neuronal, bayesien et du systeme de regles floues. A noter que la realisationdu systeme de logique floue et la validation du scenario global necessite d’avoir une basede donnees contenant a la fois des ECG seriels, ainsi que des dossiers medicaux exhaustifspour chaque patient. Cette base de donnees, en cours de construction, specifique au PEM,devrait permettre de realiser et valider le modele decisionnel global presente ci-apres.

Le scenario decisionnel global (Figure 2.18) devrait etre comme suit :

– Un patient X, presentant un certain nombre de signes de gene se sert de son PEMpour enregistrer un ECG

– Une fois enregistre et charge dans le systeme, l’ECG sera interprete par le moduleneuronal et un premier score de risque est calcule.

En fonction de ce score, l’ECG est juge comme : anormal, suspect, ou normal :

– Si l’ECG est anormal, l’alarme majeure est declenchee.

– Si l’ECG est normal, un message confortant est emis a l’utilisateur.

– Si l’ECG est suspect, le premier score de risque sera conjugue avec un deuxiemescore de risque issu du module bayesien et le score de risque global permettra dedeclencher l’alarme appropriee : majeure, moyenne, mineure.

Cette approche qui est l’une des perspectives de recherche future de nos travauxpour etre evaluee sur la base de donnees qui est en cours de constitution grace auxexperimentations pilotes qui sont actuellement realisees avec les PEM prototypes.

Chapitre 2. Aide a la decision en telecardiologie 67

Fig. 2.18 – Proposition d’un modele decisionnel global incorporant des modules bayesienet neuronal qui collaborent par l’intermediaire d’un systeme de regles de logique floue.

Chapitre 3

Acquisition de l’ECG PEM etsynthese de l’ECG standard

3.1 Introduction

Un des objectifs du projet EPI-MEDICS est de permettre a l’utilisateur d’enregis-trer ses propres ECG sans la moindre assistance. C’est la raison pour laquelle le systemed’enregistrement ECG du PEM est base sur un nombre limite d’electrodes (4), faciles apositionner, correspondant respectivement aux derivations peripheriques (DI, DII) et a laderivation precordiale V2. Ce systeme simplifie, pseudo-orthogonal, presente neanmoinsl’avantage de recueillir la quasi-totalite de l’information spatio-temporelle de l’activiteelectrique cardiaque. Or, dans le cas ou une situation d’alarme est detectee et envoyeepar le PEM, il est necessaire de rendre l’ECG critique accessible par le cardiologue desti-nataire de l’alarme, sous forme comprehensible et interpretable, a savoir l’ECG 12D, quiest, en pratique clinique, le mode de representation electrocardiologique le plus usite depar le monde. Il est ainsi essentiel de synthetiser un ECG standard 12D a partir de l’ECG3D du PEM. Cette reconstruction doit permettre non seulement une detection precisede l’ischemie, mais egalement une reproduction la plus fidele possible des caracteristiquesqu’on pourrait avoir dans l’ECG standard 12D si ce dernier avait ete enregistre simul-tanement avec l’ECG 3D du PEM.

La plupart des investigations anterieures sur la synthese de l’ECG ont generalementadopte des techniques de modelisation lineaires telles que la regression multiple. Or, cesmethodes sont tres sensibles a la position des electrodes, au bruit musculaire et auxartefacts causes par les mouvements des bras et du corps, aux interferences avec d’autresappareils,. . . Ces perturbations peuvent produire une difference significative entre les ECGet par la suite empecher une bonne qualite de synthese. En outre, les methodes de synthesedecrites dans la litterature sont quasiment toutes basees sur des methodes d’approximationpar un modele lineaire [119, 120, 121], alors que le rapport entre les signaux cardiaquesn’est pas forcement un processus lineaire [122, 123].

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 69

A notre connaissance, seuls Scherer et al [124] ont abordes le probleme de la non-linearite de la synthese de l’ECG standard 12D a partir d’un sous-ensemble de derivations(DI, DII, V2) en proposant une technique de synthese lineaire par parties obtenue en di-visant le signal ECG en quatre portions : le segment PR, le complexe QRS, le segmentST-T (y compris l’onde T) et l’intervalle TP. Pour chaque portion du signal, un modelede regression lineaire multiple calcule une matrice de transformation minimisant l’erreurquadratique moyenne (RMS) entre le signal original et le signal synthetise. L’inconvenientmajeur de cette approche concerne les discontinuites introduites au niveau des extremitesde chaque segment, discontinuites qui sont amplifiees par les niveaux des lignes de basesdes derivations DI, DII et V2. Ceci rend la methode de reconstruction extremement sen-sible aux modifications des tensions de polarisation des electrodes et explique pourquoicette methode n’est pas utilisee en routine clinique. C’est la raison pour laquelle j’aidecide de m’orienter vers des techniques resolument non-lineaires basees sur des reseauxde neurones.

Dans la suite de ce chapitre nous allons tout d’abord presenter les modalites d’acqui-sition de l’ECG PEM, puis une methode originale de synthese de l’ECG standard 12D apartir de l’ECG PEM 3D mettant en œuvre des comites de reseaux de neurones artificiels,Enfin nous evaluerons notre approche comparativement aux methodes traditionnelles dela litterature.

3.2 Modalites d’acquisition de l’ECG PEM

Le systeme d’acquisition de l’ECG du PEM est base sur le positionnement dit de”Mason-Likar” des derivations peripheriques DI et DII, et sur la derivation precordialeV2.

Les electrodes doivent etre positionnees comme indique dans la figure 3.1 :

– L’electrode ”JAUNE” doit etre placee sur l’epaule gauche (a environ 2 cm del’extremite basse de la clavicule), le plus loin possible du coeur.

– L’electrode ”ROUGE” doit etre placee sur l’epaule droite (a environ 2 cm del’extremite basse de la clavicule), le plus loin possible du coeur.

– L’electrode ”BLANC” doit etre placee dans le quatrieme espace intercostal (c’est-a-dire pour les hommes, approximativement sur la ligne joignant les 2 mamelons),a peu pres a 2 cm a gauche du sternum.

– L’electrode ”VERT” doit etre placee sur la hanche gauche (dans la crete iliaquegauche).

– L’electrode ”NOIR” doit etre placee sur la hanche droite (dans la fosse iliaquedroite).

Rappelons que le systeme Mason-Likar est le systeme de positionnement des electrodesqui est utilise traditionnellement lors des tests d’effort. Ces tests consistent en l’enregis-trement d’un ECG durant le deroulement d’un exercice physique calibre. Ils ont pour

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 70

Fig. 3.1 – Positionnement des electrodes dans l’ECG PEM 3D Vs. l’ECG standard 12D.

objectif de favoriser l’apparition, en continu ou a intervalles programmes, d’anomalies quihabituellement ne surviennent qu’a l’effort (maladie des arteres coronaires). Pour ce typede tests, un positionnement des electrodes de facon traditionnelle (12 derivations) estinadequat a cause du bruit musculaire des bras et des jambes (myogramme). Or, avec lePEM, l’utilisateur est amene a enregistrer ses propres ECG et est donc amene a bouger.D’ou l’interet du systeme de Mason-Mikar pour le positionnement des electrodes du PEM.

Cette configuration a ete concue dans le cadre du projet EPI-MEDICS avec le qua-druple objectif :

1. d’utiliser un nombre minimal d’electrodes facile a placer, particulierement dans desconditions d’utilisation a domicile, en ”selfcare”, en ambulatoire ou en situationsd’urgence ;

2. de contenir suffisamment d’informations pour diagnostiquer les ischemies et lesarythmies ;

3. de minimiser le nombre de derivations de l’ECG 12D a synthetiser (autrement ditde constituer si possible un sous-ensemble de l’ECG 12D standard) ;

4. d’optimiser la qualite de la synthese des derivations manquantes de l’ECG 12D.

Elle est basee sur une serie d’etudes dans le cadre du projet EPI-MEDICS qui ontpermis de demontrer [125] qu’une configuration pseudo-orthogonale de derivations baseesur DI, DII et V2 ou sur DI, DII et V3 contient suffisamment d’informations spatiotempo-relles pour diagnostiquer l’ischemie et l’arythmie si la prise de decision est basee sur desmethodes d’analyse multivariee ou de soft computing telles que les reseaux de neurones. Ila ete egalement demontre au cours du projet EPI-MEDICS [126], qu’en prenant les coef-

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 71

ficients de correlation entre les derivations enregistrees et synthetisees comme marqueursde la qualite de la reconstruction de l’ECG standard 12D, que les meilleurs sous-ensemblesde derivations semblent etre (DI, DII, V2), (DI, AVF, V2) et (DI, DII, V3) (tableau 3.1).Mais du fait qu’il est plus facile de placer V2, le projet a choisi (DI, DII et V2) commemeilleur sous-ensemble de derivations du PEM.

Tab. 3.1 – Correlations moyennes (en pourcentage) entre les derivations d’origine etles derivations synthetisees au moyen d’un modele de regression generique en fonction dusous-ensemble de derivations ECG 12D utilisees comme entrees pour la synthese. Resultatsextraits de [119] portant sur un ensemble d’apprentissage de 72 ECG 12D sans ensemblede test independant.

Sous-ensemble V1 V2 V3 V4 V5 V6 mDI,DII,V1 - 99.1 98.2 97.4 99.1 99.6 98.7DI,DII,V2 99.5 - 99.2 97.9 99.1 99.6 99.1DI,DII,V3 98.8 98.8 - 99,2 99.2 99.6 99.1DI,DII,V4 96.2 93.5 98.1 - 99.6 99.4 97.4DI,DII,V5 93.7 88.1 93.3 98.5 - 99.4 94.6DI,DII,V6 95.6 91.5 92.9 96.1 99.0 - 95.0

DI, AVF,V2 99.4 - 99.1 97.9 99.1 99.6 99.0

3.3 Approches conventionnelles

Dans la litterature scientifique, la reconstruction de l’ECG 12D a partir d’un sous-ensemble de derivations est generalement basee sur une matrice generique de coefficientscalcules a partir d’un ensemble d’ECG provenant de differents patients via des techniquesstatistiques telles que la regression lineaire [127, 120, 128, 121]. En outre, differentesetudes ont conclu que la reconstruction la plus fidele est realisee a l’aide d’une matrice decoefficients specifiques derives des ECG du patient [121, 127].

Toutefois, la plupart des methodes developpees pour la synthese de l’ECG 12D ontete uniquement evaluees a l’aide des criteres de qualite classique tels que les coefficientsde correlation ou l’erreur quadratique moyenne RMS (Root Mean Square Error). . . et lesenregistrements ECG 12D qui ont servi a l’evaluation des resultats etaient les memes queceux qui ont servi pour le calcul des coefficients de synthese (ensembles de test identiquesaux ensembles d’apprentissage). Tres peu d’etudes ont essaye d’evaluer l’evolution de laqualite de la reconstruction de l’ECG dans le temps, ou le bruit ou les artefacts causes pardes electrodes mal placees ou les interferences avec d’autres appareils. . . , sont susceptiblesde produire une difference significative entre les ECG et par la suite empecher une bonnequalite de synthese. En effet, dans le meilleur des cas, la validation a ete effectuee surdes ECG enregistres au maximum 24h apres le recueil des ECG sur lesquels le modele desynthese a ete parametre et en conservant la meme position des electrodes [119].

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 72

Enfin, a notre connaissance, aucune etude n’a tente de realiser une evaluation pluspoussee de la qualite de la synthese en utilisant des descripteurs syntaxiques familiersaux cliniciens tels que la presence ou l’absence d’une onde Q, le rapport de R/S. . . ouen testant l’impact de la reconstruction au niveau diagnostique et decisionnel. Il faut eneffet rappeler qu’en routine clinique le diagnostic electrocardiologique est base de faconuniverselle sur des valeurs de parametres d’amplitudes et de durees des differentes ondesdans des combinaisons de sous-ensembles de derivations parmi les 12, en fonction destypes de pathologie. Il est donc tres important de pouvoir reconstruire un ECG 12Dstandard a partir de l’ECG PEM 3D afin que ce dernier puisse etre conserve dans ledossier patient comme un ECG de reference si necessaire. En outre, la grande majoritedes logiciels d’analyse automatique de l’ECG traitant l’ECG 12D, la reconstruction del’ECG PEM en ECG 12D autorisera son reanalyse eventuelle par d’autres programmes.

3.4 Choix methodologiques

Comme le PEM est prevu pour etre utilise a grande echelle et sur le long termecomme outil d’accompagnement quotidien, il fallait tenir compte de ces contraintes endeveloppant des methodes de synthese performantes capable de s’adapter a la variabilitede jour en jour de l’ECG.

Cependant, si toutes les methodes utilisees pour la synthese de l’ECG sont basees surla regression lineaire, avec une qualite de synthese acceptable sur des ECG similaires,aucune de ces methodes n’a ete evaluee sur des ECG enregistres dans des conditionsreelles avec le risque de bruit ou d’artefacts. Dans de telles conditions, les methodes nonlineaires telles que les reseaux de neurones artificiels (ANN, artificial neural networks)nous semblaient susceptibles de compenser les faiblesses des methodes lineaires. En effet,la litterature scientifique est pleine d’exemples dans d’autres domaines d’application oules approches non lineaires ont represente une alternative plus efficace que les approchesdites classiques [129, 130].

De meme, les reseaux de neurones, mis a part leur utilisation comme classifieurs uni-versels, grace a leurs capacites d’apprentissage, sont un outil interessant pour l’approxi-mation de fonctions complexes. Plusieurs etudes [131, 132, 133] ont etabli que les reseauxde neurones multicouches standards avec seulement une couche cachee sont capables d’ap-proximer n’importe quelle fonction, si suffisamment de neurones caches sont disponibles.Dans ce sens, les reseaux de neurones sont une classe d’approximateurs universels.

C’est pour ces raisons que j’ai developpe une methode originale de synthese de l’ECG12D basee sur l’utilisation des reseaux de neurones artificiels. La methode a deux versions :une version generique et une version specifique. La version generique a pour objectif decalculer des coefficients de synthese etablis a partir de bases de donnees d’ECG standard12D. Cette matrice de transformation generique peut etre integree dans le module desynthese d’ECG du PEM lors de l’initialisation de l’outil.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 73

Toutefois, contrairement a la tres grande diversite morphologique des ECG inter-individus en fonction de l’age et du sexe au sein d’une meme categorie diagnostique[134], leur tres nette stabilite au cours du temps chez le meme sujet en l’absence de nou-velles cardiopathies [135] suggere de fait que la qualite de la reconstruction pourrait etreamelioree par l’utilisation d’une matrice de transformation specifique a chaque individu.La version specifique permet ainsi d’obtenir des coefficients de synthese personnalises al’utilisateur du PEM. Cela necessite de disposer d’au moins un ECG standard 12D dereference pour le patient en plus de l’ECG PEM afin d’etablir la matrice specifique dupatient. Idealement, l’ECG 12D de reference et l’ECG PEM devraient etre acquis simul-tanement pour s’affranchir de la variabilite naturelle d’un ECG a l’autre.

De plus, pour pouvoir tester la qualite de la synthese sur des ECG autres que ceuxqui ont servi pour l’apprentissage il faut disposer, pour chaque patient, d’au moins undeuxieme ECG 12D standard et, d’une maniere generale, de bases de donnees d’ECGseriels. Ces bases de donnees seront decrites dans la prochaine section.

3.5 Bases de donnees d’apprentissage et de test

Pour elaborer et valider nos methodes de synthese des ECG 12D, nous avons utilisedeux bases de donnees. La premiere est la base de donnees ECG de Lund, deja decritedans le chapitre 2. La deuxieme est une base de donnees composee d’ECG enregistres surdes patients hospitalises au service des soins intensifs de l’hopital cardiologique de Lyon[136], identifiee durant le projet EPI-MEDICS sous le nom de la base de donnees CHDB(Cardiology Hospital in-patients Database).

La base de donnees CHDB contient un total de 386 ECG 3D PEM et de 316ECG 12D standard enregistres par deux techniciens a moins d’une demi-heure d’in-tervalle entre les deux ECG. L’enregistrement est d’une duree de 10 sec, avec unefrequence d’echantillonnage de 500 Herz. Les ECG 12D ont ete enregistres par unelectrocardiographe numerique standard (CardietteTM). 50 ECG standard ont ete exclusparce qu’aucun ECG PEM n’a ete enregistre dans un intervalle de temps raisonnable. Dememe, 20 ECG PEM ont ete exclus parce qu’aucun ECG 12D n’a ete enregistre sur cespatients pendant la meme periode. Parmi les 266 paires restantes d’ECG enregistres surles memes patients, 6 paires ont ete exclues parce que les patients avaient un stimulateurcardiaque et 65 paires d’ECG ont ete exclues parce que les traces etaient de tres mauvaisequalite. La population d’etude issue de la base de donnees CHDB consiste finalementen une serie de 195 paires d’ECG recueillis sur 131 patients. 85 paires d’ECG ont eteenregistrees par le premier technicien et les 110 autres paires par le deuxieme technicien.

Les ECG ont ete traites par le programme de Lyon [24] afin d’extraire de l’enregistre-ment de 10 sec d’origine, un complexe P-QRS-T type d’une duree d’1 sec representatif del’enregistrement de 10 sec. De meme, le programme de Lyon a ete utilise pour determinerle debut et la fin des ondes P, QRS et T.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 74

3.6 Configuration du modele de synthese de l’ECG

standard 12D par reseaux de neurones

L’objectif de cette section est de presenter notre methode originale de synthese del’ECG standard 12D a partir de l’ECG PEM 3D mettant en œuvre des comites de reseauxde neurones artificiels. Pour construire les reseaux de neurones, un indispensable prealableest de bien selectionner les echantillons de donnees qui serviront aux apprentissages et auxvalidations. Puis nous decrirons l’architecture des reseaux de neurones qui seront utilisespour la synthese de l’ECG standard et la methode utilisee pour configurer leur structure.Enfin, nous validerons la configuration retenue sur des ECG seriels extraits de la base dedonnees de Lund.

3.6.1 Constitution des ensembles d’apprentissage et de test

A partir de la base de donnees de Lund, j’ai extrait, par selection aleatoire, un premiersous-ensemble de 100 patients appele DS1. Le sous-ensemble DS1 servira a determinerla meilleure configuration de l’architecture des reseaux de neurones. Deux autres sous-ensembles de donnees, DS2 et DS3, de 100 patients chacun, seront utilises pour evaluer laqualite de synthese des reseaux de neurones. Le sous-ensemble DS2, lui aussi obtenu partirage aleatoire, permettra de tester notre methode sur des patients selectionnes de faconaleatoire, ce qui sous-entend qu’ils sont susceptibles de presenter, en termes d’evolution,une grande variabilite intra-patients due a de possibles changements diagnostiques, a deselectrodes mal placees, a une inversion d’electrodes. . . entre l’ECG de reference et l’ECGd’urgence. Le sous-ensemble DS3 est constitue de 100 patients qui n’ont pas montre dechangements seriels significatifs sur leur 2eme ECG suivant la methode d’analyse serielleCAVIAR [26]. Le sous-ensemble DS3 permet donc de tester notre methode de synthesesur des ECG dont on a verifie qu’ils n’ont pas d’evolution diagnostique significative oud’inversion d’electrodes.

La population d’etude est ainsi composee de 300 paires d’ECG provenant de 112hommes et 188 femmes, avec un age moyen de 79 ans (40-96 ans), enregistres en moyennea un an d’intervalle (0-64 mois).

3.6.2 Evaluation de la variation naturelle intra-patients entreles ECG de reference et les ECG d’urgence

Nos trois sous-ensembles DS1-3 sont constitues d’ECG seriels enregistres en moyennea un an d’intervalle. Il pourrait donc y avoir de grandes differences entre les deux ECG.Il est donc necessaire de verifier si la difference entre les ECG de reference et les ECG

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 75

d’urgence n’est pas trop grande pour ne pas affecter outre mesure la qualite de la synthese.On effectue donc un controle de coherence en calculant, pour chacun des 300 patients,les coefficients de correlation entre les derivations DI, DII, V1, V2. . . V6 du premier etdeuxieme ECG.

3.6.3 Configuration de la structure des reseaux de neurones

Le probleme de la synthese des 5 derivations (V1, V3, V4, V5, V6) manquantes apartir du sous-ensemble des 3 derivations (DI, DII, V2) est un probleme d’approximationde fonction. Or de nombreux travaux de recherche ont montre que les reseaux de neurones[131, 132, 133], et en particulier les reseaux de type perceptron multicouches, constituentun outil de choix pour resoudre ce probleme d’approximation. Deux solutions sont alorsenvisageables : soit utiliser autant de reseaux que de signaux a generer (Figure 3.2(a)),soit d’utiliser un seul reseau a 5 sorties (Figure 3.2(b)). Notre choix s’est porte vers lasolution presentee dans la figure 3.2(b). Ce choix est justifie par les raisons suivantes :

1. Sur le plan theorique : Combiner l’approximation des derivations V1, V3. . . V6 (sor-tie du reseau) a partir des derivations DI, DII et V2 dans un seul et unique reseauapporte davantage de richesse au niveau du jeu de donnees, au niveau de la combi-naison de ces donnees et aura un impact positif sur la configuration des neuronesde la (des) couche(s) cachee(s). En plus, le fait qu’il y a une forte correlation entreles derivations spatialement adjacentes (V1-V2, V2-V3, V3-V4,. . . ) confortee par lefait que les cardiologues, en analysant l’ECG, analysent les derivations par pairesou par triplets, justifie le choix de combiner les donnees dans un reseau global.

2. Sur la plan experimental : Une serie de tests prealables nous a permis de confirmerle constat que le reseau global est meilleur que les 5 reseaux individuels.

Chaque reseau individuel consiste en une couche d’entree de 3 neurones (un pourchaque signal enregistre), une couche de sortie de 5 neurones (un pour chaque signalderive), et h couches cachees de n neurones (Figure 3.3).

Par ailleurs, il convient de noter que la solution de la synthese des fonctions V1,V3. . . V6 au moyen d’un reseau multicouches est tributaire a la fois du choix de l’architec-ture du reseau et de la selection initiale des poids et des biais. L’architecture sera definiede maniere experimentale au moyen d’une serie de tests ou l’on fera varier le nombre decouches cachees (h=1, 2), le nombre de neurones par couche cachee (n=3, 5, 8, 10, 15),et les fonctions d’activation pour les neurones des couches cachees (lineaire ou sigmoıde).

Concernant la couche de sortie, notre choix s’est porte sur des fonctions d’activationlineaire, a la fois sur la base de considerations theoriques (les relations Vi = f (DI, DII, V2)sont quasi-lineaires, les signaux sont d’amplitude crete a crete variable, et peuvent etrepositifs ou negatifs), qu’au vu des resultats de la revue de la litterature qui indique queles meilleurs resultats de l’approximation de fonctions au moyen de reseaux de neuroness’obtiennent generalement en utilisant des fonctions d’activation lineaire.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 76

(a) (b)

Fig. 3.2 – Differents types de modeles de synthese de l’ECG 12D a partir d’un sous-ensemble de derivations 3D : (a) cinq reseaux individuels avec 3 entrees et 1 sortie ; (b)reseau global avec 3 entrees, 5 sorties.

Pour depasser les limitations de performance inherents au processus d’apprentissagedes reseaux de neurones tel que la selection des parametres initiaux des reseaux, nous avonscomme dans le chapitre precedent, adopte une approche multi-experts, multi-classifieursqui consiste a utiliser des comites de N=50 reseaux de neurones artificiels. La sortie ducomite de reseaux de neurones est obtenue en moyennant les sorties des reseaux indivi-duels.

L’objectif est ici encore, de beneficier des resultats de l’application du theoreme centrallimite en combinant les sorties des 50 reseaux individuels pour ”gommer” les differencesglobales et d’obtenir des performances en termes de qualite de synthese sensiblementmeilleures que pour chacun des reseaux pris individuellement.

3.6.4 Processus d’apprentissage et d’evaluation

Idealement, pour effectuer l’apprentissage, nous aurions besoin d’au moins 3 ECGseriels par patient pour deriver un comite de reseaux de neurones specifique au patient :un premier ECG pour effectuer l’apprentissage du reseau, un deuxieme pour stopperl’apprentissage afin d’eviter le surapprentissage, et un dernier pour evaluer la capacite degeneralisation du comite. Malheureusement, les bases de donnees a notre disposition necomportent pas plus de deux ECG seriels par patient. Pour surmonter cette difficulte, j’aiadopte une strategie en deux temps qui consiste tout d’abord a determiner la structureideale des reseaux de neurones individuels et le nombre moyen d’iterations K sur unensemble d’apprentissage (en fait DS1), puis a evaluer les performances de cette structure

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 77

Fig. 3.3 – Illustration de la structure individuelle des reseaux de neurones utilises pourla synthese de l’ECG 12D : une couche d’entree de 3 neurones (DI, DII, V2), une couchede sortie de 5 neurones (V1, V3, V4, V5, V6), et h couches cachees de n neurones.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 78

ideale sur les deux ensembles de test DS2 et DS3 en stoppant l’apprentissage des reseauxde neurones specifiques au patient au bout d’un nombre d’iterations fixe egal a K.

1. Configuration des comites de reseaux de neurones : Comme indique ci-avant, onutilise le sous-ensemble DS1 pour determiner la meilleure structure des reseaux ducomite et pour calculer le nombre fixe d’iterations K a employer. Le processus est lesuivant : On realise, pour chaque patient de DS1 et pour chacun des N=50 reseauxdu comite de reseaux de neurones, un apprentissage sur l’ECG de reference dupatient. L’apprentissage est arrete lorsque la mesure d’erreur sur l’ECG de test (ECGd’urgence) du patient commence a croıtre. Ce processus est repete pour chacundes h×n×t structures (h=nombre de couches cachees ; n=nombre de neurones parcouche ; t=type des fonctions d’activation). La ”meilleure” configuration est cellequi affiche la plus faible erreur de reconstruction moyenne sur l’ensemble des 100ECG test de DS1. Le nombre d’iterations K est determine en calculant, pour chaquepatient, la moyenne du nombre maximum des iterations pour chacun des 50 reseauxindividuels et en faisant la moyenne de ces valeurs sur les 100 patients du sous-ensemble DS1.

2. Verification et validation : Le but de cette deuxieme etape est de verifier si laconfiguration des reseaux (architecture et nombre fixe d’iterations K) determineelors de l’etape precedente est performante sur d’autres sous-ensembles d’ECG, enl’occurrence, DS2 et DS3. Elle consiste a determiner, pour chaque patient, un comitespecifique de 50 ANN en utilisant les signaux de l’ECG de reference du patientcomme ensemble d’apprentissage. La structure de chaque ANN est celle determineelors de l’etape precedente et le nombre d’iterations utilise pour l’apprentissage estfixe egal a K.

Les comites de reseaux de neurones elabores sur les ECG de reference des patients deDS2 et DS3 sont ensuite utilises pour synthetiser a partir des signaux DI, DII et V2des ECG de test de DS2 et DS3, les signaux V1, V3. . . V6 supposes manquants. CesECG synthetises sont ensuite compares aux ECG originaux a l’aide d’une analysequantitative qui consiste a :

(a) Calculer l’erreur quadratique moyenne RMS (Root Mean Square) et le coeffi-cient de correlation entre les derivations originales et celles synthetisees sur latotalite du trace d’1 sec (onde P, complexe QRS et onde T compris).

(b) Comparer ces valeurs par rapport a celles obtenues en utilisant un modele deregression multiple specifique du type :

Vi = ai0 + ai1DI + ai2DII + ai3V 2 (3.1)

ou aij sont les coefficients specifiques calcules a partir des ECG de reference.

(c) Exclure, pour chacune des 2 methodes et pour chaque derivation, 5% des va-leurs RMS les plus elevees et 5% des coefficients de correlation les plus bas.Cette etape est prevue pour eviter tout biais produit par les cas extremes surle calcul des ecarts type et des moyennes [137].

(d) Effectuer des tests statistiques (paired et trimmed paired t-tests) pour verifier siles differences observees entre les comites de reseaux de neurones et les modelesde regression multiple sont statistiquement significatives.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 79

3.6.5 Resultats

Evaluation de la variabilite naturelle intra-patients entre les ECG de referenceet les ECG d’urgence originaux

Le tableau 3.2 illustre les valeurs des erreurs RMS entre le premier et le deuxiemeECG des sous-ensembles DS1, DS2 et DS3. La valeur moyenne de l’erreur RMS sur latotalite du trace d’1 sec (onde P, complexe QRS et onde T compris) pour les derivationsDI, DII, V1, V2, V3, V4, V5, V6 est de 140 µV pour DS1, 149 µV pour DS2 et 113 µVpour DS3. Ces chiffres illustrent une variabilite intra-patients entre les ECG de referenceet les ECG d’urgence plus importante pour les sous-ensembles DS1 et DS2 par rapport aDS3, ce qui pourrait avoir un effet sur la qualite de synthese. Ceci sera confirme dans lapartie consacree a l’evaluation quantitative.

Tab. 3.2 – Erreur quadratique moyenne (RMS) en µV entre les derivations DI, DII, V1,V2, V3, V4, V5 et V6 des ECG de reference et ECG d’urgence des sous ensembles DS1,DS2 et DS3, apres exclusion des 5 valeurs les plus extremes.

Derivation DS1 (N=95) DS2 (N=95) DS3 (N=95)DI 85 85 68DII 95 84 80V1 107 107 86V2 194 168 143V3 197 219 151V4 176 216 145V5 149 180 129V6 115 134 98

RMS moyenne 140 149 113

Meilleure configuration des reseaux de neurones : architecture et nombremoyen d’iterations

La determination de la ”meilleure” configuration d’un reseau de neurones est unprobleme difficile. De nombreux parametres entrent en jeu : type de reseau, nombre decouches cachees (h), nombre de neurones par couche (n), type des fonctions d’activation,algorithme d’apprentissage utilise, critere de mesure de la qualite du reseau.

Le type de reseau (perceptron multi-couches avec 3 entrees et 5 sorties) et le typede la fonction d’activation de la couche de sortie (fonction lineaire) ont ete fixes dans lasection 3 sur la base de considerations theoriques et pratiques. Concernant l’algorithmed’apprentissage, nous avons choisi une des variantes de l’algorithme de retropropagation

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 80

fournies par Matlab adapte a l’approximation de fonctions. Il s’agit de l’algorithme dedescente de gradient conjugue (scaled conjugate gradient algorithm, SCG) [138]. Enfin,concernant le critere de qualite, nous avons opte pour la mesure de l’erreur quadratiquemoyenne (RMS) entre les sorties de chaque reseau de neurones et les signaux correspon-dants reels provenant des enregistrements ECG d’urgence de DS1. D’autres criteres dequalite auraient ete possibles (mesure de la qualite diagnostique du signal reconstruit,differences de signaux en valeur absolue, . . . ), mais ont ete juges trop complexes a mettreen œuvre dans cette etape preliminaire de determination de la meilleure configurationpossible des reseaux de neurones.

La meilleure configuration ANN est determinee experimentalement en effectuant l’ap-prentissage des h×n×t structures differentes obtenues en faisant varier le nombre decouches cachees (h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le typede fonction d’activation (t=lineaire, sigmoıde : tangente sigmoıde (tansig), logarithme-sigmoıde (logsig)). La fonction d’activation utilisee dans la couche de sortie est lineaire.Les meilleurs resultats ont ete obtenus pour h=1 couche cachee de n=15 neurones, unefonction d’activation de type tangente sigmoıde et K=75 iterations. Les resultats detaillesdes performances des h×n×t structures en termes d’erreur RMS sur les ECG d’urgencede DS1 sont presentes en annexe C.

Evaluation quantitative de la qualite de la reconstruction

Pour evaluer quantitativement la qualite de la reconstruction par les reseaux de neu-rones des 5 derivations ECG (V1, V3,. . . V6) synthetisees a partir des sous-ensembles (DI,DII, V2) de l’ECG standard 12D et comparer les resultats avec ceux obtenus au moyend’une methode de synthese basee sur la regression multiple, nous avons procede commesuit :

– Nous avons d’abord commence par calculer l’erreur quadratique moyenne RMS etle coefficient de correlation (r) entre les derivations originales et celles synthetiseespar les reseaux de neurones. Les calculs sont effectues en considerant la totalite dessignaux a notre disposition c.a.d 1 sec de trace. Nous avons ensuite elimine les 5cas les plus extremes et compare les valeurs RMS et r par rapport a celles obtenuesavec la methode de regression multiple.

– Nous avons enfin effectue des tests statistiques (paired et trimmed t-tests) pourverifier si la difference observee entre les comites de reseaux de neurones et lesmodeles de regression multiple est statistiquement significative.

Les resultats de l’evaluation quantitative de la performance des comites de reseaux deneurones et des modeles de regression multiple en termes d’erreur RMS et coefficients decorrelation sont illustres dans le tableau 3.3. Ces resultats montrent la superiorite de lasynthese de l’ECG par reseaux de neurones avec une erreur RMS de 76 (DS1), 100 (DS2)et 64 (DS3) µV en moyenne et une correlation moyenne de 92% (DS1), 91% (DS2) et97% (DS3) par rapport a celle de la regression multiple avec une erreur RMS moyennede 83 (DS1), 108 (DS2), et 73 (DS3) µV et une correlation moyenne de 91% (DS1), 90%

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 81

(DS2) et 96% (DS3). A noter que la performance est meilleure pour les ECG du sous-ensemble DS3 par rapport a ceux de DS1 et DS2. Cela montre qu’une grande partie de ladifference observee entre les derivations originales et celles synthetisees pourrait etre duea des electrodes mal placees ou a un changement physiologique ou diagnostique de l’etatdu patient dans les sous-ensembles DS1 et DS2.

Le tableau 3.4 resume les resultats des tests statistiques effectues sur les valeurs deserreurs RMS des 2 methodes. D’apres ces resultats, dans les deux approches de synthese,la difference entre les reseaux de neurones et la regression multiple est statistiquementsignificative (p≤0.001).

Tab. 3.3 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation (r)entre les derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseauxde neurones specifiques (ANN-S) et les modeles de regression specifiques (REG-S) surles ECG des sous-ensembles DS1, DS2 et DS3, apres elimination des 5 valeurs les plusextremes.

DS1 (N=95) DS2 (N=95) DS3 (N=95)Derivation RMS r RMS r RMS r

A V1 62 .94 68 .93 48 .97N V3 91 .91 117 .88 80 .95N V4 92 .88 127 .88 80 .96- V5 77 .92 104 .92 65 .97S V6 59 .94 83 .91 48 .98

R V1 64 .93 74 .93 55 .96E V3 99 .91 123 .89 84 .94G V4 109 .87 148 .86 96 .95- V5 85 .91 112 .91 76 .96S V6 61 .94 83 .91 52 .98

Tab. 3.4 – Comparaison par les tests statistiques (t-tests : pairwised et trimmed) de ladifference en termes d’erreur RMS obtenue par les comites de reseaux de neurones et lesmodeles de regression specifiques.

Sous-ensembles Pairwised t-test Trimmed t-test

DS1 (N=95) < 10−4 < 10−5

DS2 (N=95) < 10−3 < 10−5

DS3 (N=95) < 10−7 < 10−9

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 82

3.6.6 Discussion

Il est toujours difficile de comparer des resultats d’evaluation d’une nouvelle methodetelle que la methode de synthese des ECG par ANN a ceux publies dans la litteraturelorsque les bases de donnees utilisees sont differentes. Les resultats vont dependre nonseulement du type de population et des cardiopathies, mais egalement des caracteristiquestechniques de l’enregistrement des ECG et des mesures utilisees pour evaluer la qua-lite de la synthese. Ainsi les valeurs RMS seront fortement tributaires de la frequenced’echantillonnage et des intervalles ECG consideres. Les coefficients de correlation serontmaximum lorsque l’on ne considere que l’onde QRS, et seront plus faible lorsque l’on prenden compte la totalite des ondes P, QRS et T. Il est donc indispensable de confronter lesresultats d’une nouvelle methode par rapport a ceux obtenus avec une methode standarden utilisant la meme base de donnees et les memes mesures de dissimilarite. C’est ce quenous avons fait en comparant les resultats de notre methode de synthese par ANN avecceux obtenus en mettant en œuvre sur les memes donnees une methode de synthese parregression multiple.

Les chiffres les plus realistes publies dans la litterature mentionnent des coefficients decorrelation medians de respectivement r=0.978 pour des traces enregistres a t=0 sec d’in-tervalle (ie l’ensemble de test est le meme que l’ensemble d’apprentissage) et r=0.953 pourdes enregistrements realises a 24h d’intervalle sans changement de position des electrodes(methode de regression specifique, [119]). Les chiffres que nous avons obtenus sur DS2sont de respectivement r=0.942 pour la regression lineaire et r=0.947 pour les comites dereseaux d’ANN, sachant que, a la difference des resultats publies par Nelwan et al [119],nos resultats ont ete obtenus sur des traces enregistres en moyenne a 1 an d’intervalle eten considerant 1 sec de traces (soit la totalite des intervalles P, QRS, T) au lieu du seulintervalle QT.

Quoique non comparables a cause de la nature des ECG de notre population d’etude,nous estimons que les resultats que nous avons obtenus tant en termes de coefficients decorrelation moyens que d’erreurs RMS nous semblent suffisamment probants pour pouvoirdire que la methode de synthese par comites de reseaux de neurones specifiques surpassetres nettement la methode de synthese par regression specifique et meriterait d’etre miseen œuvre en routine clinique.

3.6.7 Conclusion

La qualite de la reconstruction de l’ECG 12D par reseaux de neurones par rapporta l’approche classique de synthese par regression lineaire m’a encourage a continuer aeffectuer une evaluation quantitative plus poussee de la qualite de synthese en estimant ledegre d’alteration du diagnostic des ECG synthetises par rapport aux ECG de reference.Dans cette perspective, j’ai realise une evaluation de l’approche de synthese par reseauxde neurones d’un point de vue decisionnel en utilisant une population d’etude composee

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 83

de plus de 800 paires d’ECG 12D classes soit dans la categorie apparition d’un infarctusaigue (AMI), soit dans la categorie controles extraits de la base de donnees de Lund. Lamethode d’evaluation et les resultats sont presentes ci-apres en section 3.7.

Une autre etape est d’evaluer les potentialites de notre methode pour synthetiserun ECG standard 12D a partir de l’ECG 3D enregistre par le PEM. Cependant, pourevaluer la qualite des syntheses de l’ECG standard a partir de l’ECG PEM, il faut dis-poser d’une base de donnees regroupant a la fois, et pour chaque patient, plusieurs pairesECG PEM, ECG standard 12D chronologiquement homologues. Idealement chaque paired’ECG devrait etre enregistree de facon synchrone et serielle. L’acquisition des pairesd’ECG devrait etre effectuee a plusieurs jours voire plusieurs mois d’intervalle. Cela nouspermettrait d’effectuer une evaluation, a la fois en termes de similarite entre l’ECG 12Dsynthetise a partir de l’ECG PEM et l’ECG 12D original, et en termes de contenu diag-nostique de l’ECG synthetise par rapport a celui d’origine. Malheureusement a ce jour,nous ne disposons pas de telles bases de donnees. Pour circonvenir ce defaut, j’ai adopteune approche alternative qui consiste en une evaluation sur un ensemble d’ECG de labase de donnees CHDB.

3.7 Evaluation diagnostique sur la base de donnees

de Lund

Apres avoir teste dans la section precedente, a l’aide de criteres traditionnels de qualite(erreur quadratique moyenne RMS et coefficient de correlation), la capacite des reseauxde neurones a synthetiser l’ECG 12D a partir d’un sous-ensemble de derivations (DI, DII,et V2), l’objectif de cette section est de presenter une evaluation de l’approche de synthesepar reseaux de neurones d’un point de vue decisionnel en utilisant une population d’etudeextraite de la base de donnees de Lund et composee d’ECG d’infarctus et d’ECG decontrole. En d’autres termes, il s’agit d’observer l’impact de la synthese sur l’interpretationde l’ECG derive par rapport a celle obtenue sur l’ECG d’origine correspondant. Pourcela, je me suis servi d’un programme d’interpretation automatique developpe a partir dumodele presente dans le chapitre precedent (Figure 3.4) :

– pour comparer le degre de concordance des interpretations realisees par le pro-gramme sur les ECG d’urgence reconstruits par rapport a la verite clinique, i.e. lacategorie a laquelle appartient l’ECG d’urgence d’origine,

– pour mesurer la concordance entre les interpretations du programme sur les ECGd’urgence reconstruits par rapport a celles realisees sur les ECG d’urgence d’origine.

Dans le reste de cette section, nous allons d’abord presenter les ensembles d’apprentis-sage et de test que nous avons construit pour evaluer la methode de synthese par reseauxde neurones. Ensuite, nous allons presenter les protocoles d’evaluation et enfin les resultatsdes evaluations effectuees par rapport a la regression multiple.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 84

Fig. 3.4 – Programme d’interpretation automatique de l’ECG suivant 4 niveaux de risque.

3.7.1 Ensemble d’apprentissage et ensemble de test

A partir de la base de donnees de Lund, j’ai extrait le meme sous-ensemble de test,compose de 988 paires d’ECG (199 cas d’AMI et 789 cas de controle) que celui utilisepour tester la methode de diagnostic par reseaux de neurones developpee dans le chapitre2. Ensuite, j’ai elimine toutes les paires d’ECG contenant des blocs (c’est a dire avecune duree de l’onde QRS superieure a 120 ms). L’ensemble de donnees final est donccompose de 808 paires d’ECG enregistres en moyenne a un an d’intervalle (0-7 ans),provenant de 411 hommes et 397 femmes avec un age moyen de 71 ans (40-95 ans).Parmi ces 808 patients, 151 ont developpe un infarctus aigue lors de leur admission dansle service d’urgence et comme explique dans le chapitre 2, leur ECG d’urgence a eteclasse dans la categorie infarctus. En consequence, nous avons classe les 151 paires d’ECGcorrespondants dans la categorie d’infarctus (AMI), et les 657 paires d’ECG restants dansla categorie de controle. Dans la suite, nous appelons ensemble d’apprentissage, l’ensembleforme des 808 ECG de reference et ensemble de test, l’ensemble des 808 ECG d’urgencecorrespondants.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 85

3.7.2 Configuration et apprentissage des comites de reseaux deneurones specifiques aux patients

Pour synthetiser les derivations (V1, V3, V4, V5, V6) a partir du sous-ensemble dederivations (DI, DII, V2), j’ai utilise comme precedemment des comites de 50 reseaux deneurones artificiels. L’architecture de chaque reseau individuel, l’algorithme d’apprentis-sage ainsi que le nombre d’iterations sont ceux decrits dans la section 3.6.

Pour chacun des 808 patients de la population d’etude, un comite de reseaux de neu-rones specifique au patient est calcule. L’apprentissage des reseaux est effectue sur l’ECGde reference avec un nombre d’iterations fixe pour eviter le sur-apprentissage. L’ECGd’urgence va ensuite servir pour evaluer la capacite de generalisation du comite.

3.7.3 Comparaison des interpretations automatiques des ECGsynthetises par rapport a la verite clinique

Ce premier test a pour objectif d’evaluer la qualite de la synthese par comites dereseaux de neurones et par regression en mesurant la concordance entre la verite cliniquedes ECG originaux d’urgence et le diagnostic obtenu par application du programme d’in-terpretation automatique developpe dans le chapitre precedent. Le protocole d’evaluationque nous avons mis en œuvre commence par extraire les 808 ECG d’urgence classes endeux categories : infarctus et controle de la base de donnees, puis a creer les deux ECG desynthese en appliquant tour a tour les deux types de transformations specifiques, comitesde reseaux de neurones et regression multiple. Ensuite, la deuxieme etape est l’applica-tion du logiciel de diagnostic sur les ECG generes par les methodes de synthese, ainsi quesur les ECG originaux. Le programme classifie les ECG en 4 categories suivant le risqued’infarctus : pas de risque, risque mineur, risque moyen et risque majeur. La troisiemeetape consiste a combiner les ECG appartenant aux deux premieres categories : pas derisque et risque mineur, et a les considerer comme ECG de controle. De meme, les ECGappartenant aux categories restantes : risque moyen et majeur, sont consideres commeetant des ECG d’infarctus. La derniere etape est la comparaison de l’interpretation au-tomatique par rapport a la verite clinique. Cette comparaison est realisee par le biais decourbes ROC. Pour chacun des 2 ensembles d’ECG : ECG reconstruits par comites dereseaux de neurones et ECG reconstruits par regression, une courbe ROC est calculee. Ledegre de concordance entre verite clinique et interpretation automatique est mesure parl’aire sous la courbe ROC. Plus l’aire sous la courbe ROC est elevee, plus la methode desynthese est performante.

La figure 3.5 illustre les courbes ROC resultant de la comparaison de l’interpretationautomatique des 808 ECG d’urgence de la population d’etude reconstruits par reseauxde neurones et par regression par rapport a la verite clinique sur les ECG originaux.La performance, mesuree par le biais de l’aire sous la courbe ROC, est respectivement

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 86

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1−Spécificité

Sen

sibi

lité

Comité spécifique, aire = 0.862Régression spécifique, aire = 0.854

Fig. 3.5 – Courbes ROC resultant de la comparaison entre la classification des ECGderives par reseaux de neurones et par regression, par rapport a la verite clinique desECG originaux correspondants.

0.862 pour les ECG synthetises par reseaux de neurones et 0.854 pour ceux synthetisespar regression. Ces resultats sont remarquablement eleves car a peine inferieurs a ceuxobtenus sur les ECG originaux (aire de 0.872), avec un net avantage de la methode desynthese par reseaux de neurones par rapport a la regression.

Comparaison des interpretations automatiques des ECG synthetises par rap-port aux interpretations automatiques des ECG d’origine

Le deuxieme test d’evaluation de la qualite de la synthese par comites de reseauxde neurones et par regression a pour objectif de mesurer la concordance entre les in-terpretations des ECG synthetises et les interpretations des ECG d’urgence originaux. Cetest permettra de verifier si notre methode de synthese permet de reconstruire des ECGrenfermant suffisamment d’information diagnostic pour que les logiciels d’interpretationautomatique fournissent des diagnostics concordant a ceux qui seraient obtenus sur lesECG originaux.

Le tableau 3.5 illustre les cas de concordance (elements sur la diagonale de la matricede confusion) et de discordance d’interpretation entre les ECG d’origine et les ECG derivespar reseaux de neurones et par regression.

L’analyse des resultats nous apprend deux choses :

1. La qualite de synthese realisee par les comites de reseaux de neurones permet une

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 87

meilleure concordance d’interpretation entre ECG originaux et synthetises par rap-port a la performance realisee par la methode de regression.

2. Tous les elements de la matrice de confusion, en dehors de la tridiagonale, sont nulsce qui signifie que les interpretations entre l’ECG original et les ECG de synthese nedifferent au maximum que de un degre dans l’estimation de la qualite de l’ischemie,et donc qu’il n’y a pas de discordance severe entre les interpretations. Le fait quele diagnostic puisse passer d’une categorie a la categorie adjacente est d’autant plusprobable que la sortie des ANN est proche des seuils de decision.

Tab. 3.5 – Concordance entre les interpretations des ECG originaux et les interpretationsdes ECG synthetises par reseaux de neurones (ANN-S) et par regression (REG-S). Lelogiciel de diagnostic classe les ECG suivant 4 categories de risque : pas de risque, risquemineur, moyen et majeur.

Original pas de risque risque mineur risque moyen risque majeur(383) (219) (110) (96)

ANN-Spas de risque (374) 351 22 1 0risque mineur (209) 32 160 17 0risque moyen (119) 0 36 76 7risque majeur (106) 0 1 16 89

REG-Spas de risque (379) 350 29 0 0risque mineur (212) 32 158 22 0risque moyen (113) 1 32 73 7risque majeur (104) 0 0 15 89

3.7.4 Discussion & Conclusion

Apres avoir prouve au cours de la section 3.6 la faisabilite de l’approche de synthese del’ECG standard 12D a partir d’un sous-ensemble de derivations par le biais de comites dereseaux de neurones, cette section vient renforcer les premieres constatations de l’efficacitede l’approche. En effet, la deuxieme phase d’evaluation exposee dans cette section a montreque les comites de reseaux de neurones depassent en qualite de synthese les methodespronees par la litterature scientifique [121, 128], basees sur la regression multiple. Deplus, les ECG 12D derives a partir du sous-ensemble de derivations : DI, DII et V2contiennent suffisamment d’information diagnostic et sont suffisamment similaires auxECG 12D d’origine pour permettre une concordance d’interpretation tres elevee. Encorefaut-il tester l’efficacite de la methode a synthetiser l’ECG standard 12D a partir de l’ECG3D enregistre par le PEM d’EPI-MEDICS. Autrement dit, il s’agit de prouver la capacitede la methode des comites de reseaux de neurones a synthetiser des ECG 12D a partird’ECG 3D enregistres dans un contexte de telemedecine citoyenne. Ce sera l’objectif dela prochaine et derniere etape de validation que nous presentons ci-apres.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 88

3.8 Evaluation de la qualite de la synthese des ECG

standards 12D a partir des ECG 3D du PEM

3.8.1 Objectifs

Si l’interet de notre approche de synthese d’ECG par reseaux de neurones est dejaprouve, l’etape logique suivante est d’evaluer la performance de la methode sur les ECG3D du PEM enregistres a plusieurs jours d’intervalle, tenant compte des conditions d’ac-quisition des ECG et d’un minimum de variabilite de jour en jour de l’ECG. Rappelonsque le systeme d’acquisition de l’ECG du PEM est base sur le positionnement de ”Mason-Likar” des derivations peripheriques DI et DII, et sur la derivation precordiale V2, et quel’utilisateur est amene a enregistrer ses propres ECG et est donc amene a bouger.

L’evaluation de la qualite de la synthese de l’ECG standard 12D a partir de l’ECGPEM 3D sera effectuee sur un sous-ensemble d’ECG 12D et PEM 3D de la base dedonnees CHDB que nous decrirons dans la section suivante. Cette evaluation va consistertout d’abord a utiliser des criteres traditionnels de qualite (erreur quadratique moyenneRMS et coefficient de correlation) pour mesurer la capacite des reseaux de neurones asynthetiser l’ECG 12D a partir d’un sous-ensemble de derivations (DI, DII, et V2) duPEM. Toutefois, la mise en œuvre de cette approche n’est pas simple. En effet, pour pallieraux contraintes liees a l’utilisation de deux appareils differents (PEM pour les ECG 3D etCardiette pour les ECG 12D) pour enregistrer les ECG et au fait que l’enregistrement desdeux ECG (12D et 3D) n’est pas synchronise, il est indispensable de recourir d’abord a unprocede d’alignement des signaux avant de pouvoir effectuer des mesures des differencesentre les derivations reconstruites et celles de reference. Ensuite, nous effectuons uneevaluation d’un point de vue diagnostic pour tester l’impact de la synthese sur la qualitede l’interpretation. Ceci sera realise en mesurant la concordance entre les interpretationselaborees par le programme d’interpretation automatique, developpe dans le chapitre 2,sur les ECG 12D reconstruits a partir des ECG PEM 3D, et les interpretations realiseessur les ECG Cardiette d’origine. Ces dernieres sont considerees comme etant la verite.

De plus, par rapport aux sections precedentes, nous presenterons deux versions dela methode de synthese : une version generique ayant pour objectif de calculer des co-efficients de synthese etablis a partir d’un ensemble d’ECG standard 12D, ainsi qu’uneversion specifique permettant d’obtenir des coefficients de synthese personnalises a l’uti-lisateur du PEM a partir de ses propres ECG. En effet, lors de la premiere utilisation duPEM, il est probable que l’on ne dispose pas encore de transformation specifique, et il estdonc important de savoir s’il faut plutot utiliser une matrice de transformation generiqueobtenue par regression multiple ou une methode de synthese basee sur des comites dereseaux de neurones.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 89

3.8.2 Population d’etude

Pour constituer notre population d’etude, nous avons extrait de la base de donneesCHDB une serie de paires d’ECG en appliquant un ensemble de regles decrites ci-apres.

Rappelons, en preambule, que la base de donnees CHDB contient, apres un premiercontrole de qualite et de coherence, 195 paires d’ECG provenant de 131 patients. Chaquepatient possede une, deux, voire plusieurs paires d’ECGs (Tableau 3.6). Chacune despaires consiste en un ECG standard 12D et en un ECG PEM 3D base sur les derivationsDI, DII et V2.

Tab. 3.6 – Description de la base de donnees CHDB.

195 paires d’ECG (3D et 12D) pour 131 patientsNb de patients Nb de paires par patient

83 136 29 32 41 5

Controle de qualite et de coherence

Interpretation des ECG par des experts humains Chaque ECG 12D de la base dedonnees CHDB a ete interprete de maniere independante par un cardiologue experimente.Chaque ECG a ete classe dans l’une des deux categories suivantes :

1. ACS (Acute Coronary Syndrome), si un syndrome coronarien aigu (ACS) a etediagnostique sur l’ECG.

2. Controle, si l’ECG enregistre provenait d’un patient pour lequel le diagnostic etaitautre que ACS.Les 195 ECG standard 12D ont ete classes en respectivement 60 cas diagnostiquesACS et 128 cas de controle. Les 7 cas restants n’ont pu etre diagnostique et ontdonc ete elimines de notre base de donnees.

A l’issue de cette etape, notre ensemble de donnees est forme de 188 paires d’ECG pro-venant de 130 patients se repartissant ainsi :

1. 83 patients ont 1 paire d’ECG,

2. 39 patients ont 2 paires d’ECG,

3. 5 patients ont 3 paires d’ECG,

4. et 3 patients ont 4 paires d’ECG.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 90

Nous avons donc subdivise la base CHDB en deux sous-ensembles : SE1 est forme des83 patients de la population d’etude ayant une seule paire d’ECG PEM 3D et Cardiette12D et SE2 est forme des 47 patients ayant au moins deux paires d’ECG PEM et Cardiette.Pour les 8 patients du sous-ensemble SE2 ayant plus de deux paires d’ECG, nous n’avonsretenu que les deux premieres paires d’ECG 3D et 12D a condition qu’elles aient eteenregistrees a au moins 1 jour d’intervalle. SE2 est donc constitue de 47×2 paires d’ECGprovenant de 47 patients. Les 94 paires d’ECG standard et les 94 paires d’ECG PEM ontete enregistres en moyenne a 3 (1-21) jours d’intervalle.

Processus de controle de la coherence entre les ECG PEM et les ECG 12Dstandards Du fait que l’enregistrement des ECG n’est pas synchrone et en raison dustatut cardiaque tres evolutif typique des patients dans un service de soins intensifs, ilpourrait y avoir de grandes differences entre les deux ECG PEM et 12D, souvent acquis aquelques dizaines de minutes d’intervalle, et plus encore pour les cas de SE2, ou les deuxpaires d’ECG ont ete enregistrees jusqu’a 3 jours d’intervalle. Ces differences pourraientaffecter de maniere considerable la mesure des ecarts entre les ECG de synthese et lesECG 12D d’origine, surtout en cas d’apparition de troubles de la conduction ou du faitde l’evolution d’une ischemie aigue. Les differences imputables a l’evolution de l’etat car-diaque pourraient en effet etre beaucoup plus importantes que celles dues aux algorithmesde reconstruction des derivations manquantes.

L’objectif de cette etape est donc de verifier si la difference entre les ECG PEM et Car-diette n’est pas trop grande et d’eliminer les paires d’enregistrements dont les differencesdepassent un certain seuil, pour eviter de fausser les mesures de la qualite de la synthese.Le controle de coherence est effectue comme suit : pour chacun des 47 patients du sous-ensemble SE2, une analyse de correlation est effectuee entre les derivations DI, DII, V1,V2. . . V6 du premier et deuxieme ECG Cardiette et entre les derivations DI, DII et V2du premier ECG Cardiette et du deuxieme ECG PEM. Enfin, une troisieme et derniereanalyse de correlation est effectuee entre les derivations DI, DII et V2 du deuxieme ECGCardiette et de l’ECG PEM associe. Les traces sont juges coherents si aucun des coeffi-cients de correlation entre deux derivations chronologiquement homologues n’est inferieura 0.2, seuil etabli de facon experimentale sur la base de donnees etudiee. A la suite decette etape, 10 patients ont ete elimines du sous-ensemble SE2. L’ensemble de donneesfinal consiste donc en une serie de (83+37) 157 paires d’ECG collectees sur 120 patients(82 hommes, 38 femmes ; moyenne d’age ± ecart type = 61 ± 15 ans). Un syndrome co-ronarien aigu (ACS) a ete diagnostique sur 46 (29%) des 157 ECG standard 12D : (SE1 :21 ECG ACS et 62 ECG de controle et SE2 : 25 ECG ACS et 49 ECG de controle).

3.8.3 Pretraitement des ECG

Pour aligner les traces ECG issus du PEM et des electrocardiographes 12D, nous avonstout d’abord aligne les debuts des QRS (determines par le programme de Lyon) des deux

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 91

traces puis nous avons evalue, au moyen d’un algorithme de correlation croisee (crosscorrelation) [139] le decalage entre les deux enregistrements en analysant les segmentsallant du debut de l’onde Q jusqu’a la fin de l’onde T (QT) des derivations V2 des deuxsignaux comme suit (Figure 3.6) :

– Calcul de la correlation croisee dans l’intervalle QT.

– Estimation du decalage entre les deux signaux par la localisation de la valeur maxi-male de la fonction de correlation.

– Utilisation du decalage calcule par correlation croisee pour aligner toutes lesderivations des ECG PEM et Cardiette.

3.8.4 Configuration de la structure des reseaux de neurones

Pour synthetiser les derivations (V1, V3, V4, V5, V6) a partir du sous-ensemblede derivations (DI, DII, V2) enregistrees par le PEM, nous avons utilise commeprecedemment un ensemble de comites de 50 reseaux de neurones artificiels constituesde perceptrons multi-couches (PMC). L’apprentissage des PMC est effectue a l’aide d’unalgorithme de retropropagation supervisee (scaled conjugate gradient algorithm, SCG).Chaque reseau consiste en une couche d’entree de 3 neurones (un pour chaque signal en-registre), une couche de sortie de 5 neurones (un pour chaque signal derive), et 1 couchecachee de 15 neurones. En d’autres termes, il s’agit de la meme configuration que celle quenous avions obtenue lors de l’evaluation sur la base de donnees de Lund dans les sectionsprecedentes.

3.8.5 Processus d’apprentissage des reseaux de neuronesgeneriques

Pour palier au fait que nous ne disposions que d’un nombre restreint d’ECG standard12D (83 ECG), nous avons adopte un processus d’apprentissage du comite de reseauxde neurones generiques mettant en œuvre une technique de validation croisee (cross-validation), deja expliquee dans le chapitre 2, comme suit : l’ensemble des 83 ECG 12D deSE1 est divise en M=10 sous-ensembles egaux et disjoints. Ensuite, pour I = 1 a M, chaquereseau individuel du comite realise un apprentissage sur les M−1 sous-ensembles restant etl’erreur est calculee sur le sous-ensemble I, servant de validation. Les ECG des M−1 sous-ensembles sont juxtaposes pour former un enregistrement ECG artificiel continu. L’arretde l’apprentissage est realise en surveillant l’erreur de reconstruction (erreur quadratiquemoyenne, RMS) sur le sous-ensemble restant I, ou les ECG ont ete egalement juxtaposespour former un enregistrement ECG continu. Le cycle d’apprentissage est repete tant quel’erreur obtenue en sortie sur les donnees de l’ensemble de validation I est decroissante.La procedure est repetee N fois pour chacun des reseaux du comite. Un nombre fixed’iterations K est alors determine en memorisant pour chacun des M×N apprentissages lenombre d’iterations et en calculant la moyenne de ces valeurs. Enfin, l’apprentissage des

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 92

Fig. 3.6 – Illustration de l’alignement des signaux ECG par correlation croisee.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 93

N=50 PMC est refait en utilisant la totalite de l’ensemble de donnees SE1 et en prenantcomme critere d’arret le nombre fixe d’iterations calcule lors de l’etape precedente (Figure3.7).

3.8.6 Processus d’apprentissage des reseaux de neuronesspecifiques

Comme deja indique plus haut, l’ideal serait d’avoir au moins 3 ECG seriels par patientpour realiser un apprentissage specifique au patient. Or avec SE2, nous ne disposons aumaximum que de 2 enregistrements seriels par patient. Pour compenser ce manque dedonnees, nous avons adopte la meme strategie que pour la base de donnees de Lunden utilisant comme critere d’arret de l’apprentissage un nombre fixe d’iterations K. Enpratique nous avons retenu la valeur de K que nous avons calcule sur les 83 ECG 12D deSE1, soit K=56. Pour chacun des 37 patients du sous-ensemble SE2, nous avons configureun comite de reseaux de neurones specifiques. L’apprentissage de chacun des N=50 reseauxdu comite est effectue sur le premier ECG 12D. Cet apprentissage est conditionne par lenombre fixe d’iterations K.

3.8.7 Verification et validation de la synthese de l’ECG 12D

Pour verifier la capacite de generalisation des deux versions generique et specifique denotre methode de synthese de l’ECG par comites de reseaux de neurones, nous avons testeles deux types de comites sur la deuxieme paire d’ECG 12D et ECG PEM des 37 patientsdu sous-ensemble SE2 (la deuxieme paire d’ECG par patient). Quatre syntheses sontrealisees au total pour chacune des paires d’ECG en appliquant tour a tour les comites dereseaux de neurones generiques puis specifiques aux derivations DI, DII et V2 de l’ECGCardiette et de l’ECG PEM. La qualite de ces syntheses sera evaluee a deux niveaux :

1. Evaluation quantitative par mesures de similarite : il s’agit d’evaluer la similariteentre les signaux d’origine et ceux synthetises a l’aide de mesures du type erreurquadratique moyenne (RMS) et coefficient de correlation. Pour cette comparaison,nous avons utilise l’intervalle QT (en fait Q-onset -18 a T-offset + 38 msec) del’ECG (Figure 3.8).

Les mesures d’erreur et de correlation obtenues sur les ECG synthetises par comitesde reseaux de neurones generiques et specifiques sont ensuite comparees par rap-port a celles obtenues en utilisant des modeles de regression multiple generiques etspecifiques. Ensuite, pour chacune des 4 methodes et pour chaque derivation, 5%des valeurs RMS les plus elevees et 5% des coefficients de correlation les plus bas.Enfin, deux tests statistiques, paired et trimmed paired t-tests, sont effectues pourdeterminer si les differences enregistrees entre les deux approches sont statistique-ment significatives.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 94

Fig. 3.7 – Illustration de l’apprentissage et de la validation des comites de reseaux deneurones generiques et specifiques.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 95

Fig. 3.8 – Visualisation des intervalles de temps utilises pour l’apprentissage des comitesde reseaux de neurones generiques et specifiques (PT : P-Onset -18 a T-offset +38 msec)et pour tester leur capacite de generalisation (QT : Q-onset -18 a T-offset +38 msec). Encas d’absence de l’onde P, on remplace le pointeur P-onset par un pointeur virtuel tel quel’intervalle PQ correspondant a l’intervalle PQ moyen.

2. Evaluation diagnostique : l’exactitude de la reconstruction de l’ECG 12D est evalueeau niveau diagnostique en mesurant le degre de concordance entre les resultatsde l’interpretation automatisee de l’ECG de reference et ceux obtenus sur l’ECGsynthetise. Cette interpretation est realisee de la meme facon que pour la base dedonnees de Lund en utilisant le programme de diagnostic developpe dans le chapitre2 pour classer respectivement les ECG derives par voie generique et ceux generespar voie specifique a l’aide des comites de reseaux de neurones et des modeles deregression multiple. Nous comparons ensuite les interpretations des ECG synthetisesau moyen des modeles de transformations generiques et specifiques aux resultatsde la stratification en deux groupes (controle et infarctus) des ECG de reference,realisee par le meme programme que ci-dessus, resultat qui sera considere commeetant la verite. La meilleure methode de synthese est celle qui fournit la meilleureconcordance.

3.8.8 Resultats

Evaluation de la variabilite inter-patients naturelle des ECG

Le tableau 3.7 illustre les valeurs des erreurs RMS et des coefficients de correlationentre le premier et le deuxieme ECG standards de SE2 enregistres a 3 jours d’intervalleen moyenne en unite de soins coronariens. La valeur moyenne de l’erreur RMS dansl’intervalle QT (Q-onset -18 a T-offset +38 msec) pour les derivations DI, DII, V1, V2,

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 96

V3, V4, V5, V6 est de 106 µV. Le coefficient de correlation est 0.92 en moyenne.

Les deux tableaux suivants presentent les resultats entre chacun de ces ECG Cardietteet le deuxieme ECG PEM, afin d’observer une double confrontation.

Le tableau 3.8 illustre les valeurs des erreurs RMS et des coefficients de correlationentre le premier ECG Cardiette et le deuxieme ECG PEM. La valeur moyenne de l’erreurRMS dans l’intervalle QT pour les derivations DI, DII et V2 est de 107 µV. Le coefficientde correlation est de 0.87 en moyenne.

Enfin, le tableau 3.9 illustre les valeurs des erreurs RMS et des coefficients decorrelation entre le deuxieme ECG Cardiette et l’ECG PEM associe. La valeur moyennede l’erreur RMS au niveau de l’intervalle QT pour les derivations DI, DII et V2 est de 80µV. Le coefficient de correlation est 0.93 en moyenne.

Tab. 3.7 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation entreles derivations DI, DII, V1, V2, V3, V4, V5 et V6 du premier et du deuxieme ECGCardiette du sous ensemble SE2, apres elimination des 5% des cas les plus extremes(N=35).

Cardiette 1 vs Cardiette 2Derivation RMS (±σ) r (±σ)

DI 60 (± 30) .93 (±) 0.09DII 73 (± 32) .85 (±) 0.18V2 125 (± 58) .95 (±) 0.07

V1 82 (± 44) .95 (±) 0.08V3 135 (± 57) .95 (±) 0.04V4 136 (± 56) .92 (±) 0.08V5 139 (± 59) .90 (±) 0.13V6 100 (± 41) .91 (±) 0.10

Tab. 3.8 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation entreles derivations DI, DII et V2 du premier ECG Cardiette et du deuxieme ECG PEM dusous ensemble SE2 (N=35).

Cardiette 1 vs PEM 2Derivation RMS (±σ) r (±σ)

DI 93 (± 42) .84 (±) 0.18DII 98 (± 39) .83 (±) 0.19V2 130 (± 64) .94 (±) 0.07

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 97

Tab. 3.9 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation entreles derivations DI, DII et V2 du deuxieme ECG Cardiette et de l’ECG PEM associe dusous ensemble SE2 (N=35).

Cardiette 2 vs PEM 2Derivation RMS (±σ) r (±σ)

DI 78 (± 38) .88 (±) 0.16DII 74 (± 36) .92 (±) 0.11V2 87 (± 33) .98 (±) 0.03

Ces resultats illustrent tout d’abord la variabilite de jour en jour de l’ECG standard12D (Cardiette 1 vs Cardiette 2). Cette variabilite est accentuee avec l’introduction dupositionnement Mason-Likar pour l’ECG PEM sur les derivations DI et DII (Cardiette1 vs PEM 2). Ce double effet va avoir des consequences importantes sur la qualite de lasynthese de l’ECG standard.

Evaluation quantitative

Derivations precordiales (V1, V3. . . V6) synthetisees a partir de (DI, DII, V2)de l’ECG Cardiette Les resultats de l’evaluation quantitative en termes d’erreur RMSet coefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees apartir de (DI, DII, V2) de l’ECG Cardiette 2 de SE2 en utilisant tour a tour le comite dereseaux de neurones et le modele de regression generiques deduits a partir des ECG 12Dde SE1 sont illustres dans le tableau 3.10. Ces resultats montrent une legere superiorite dela synthese des ECG par reseaux de neurones, avec une RMS moyenne de 122 µV dans lesegment QT versus une RMS moyenne de 126 µV pour la regression generique. Au niveaude la correlation entre les derivations synthetisees et les derivations originales, les deuxmethodes affichent une performance a peu pres similaire avec une correlation moyenne de0.93.

L’evaluation quantitative des comites de reseaux de neurones et des modeles deregression specifiques est illustree dans le tableau 3.11. Ces resultats montrent une asseznette superiorite de la synthese d’ECG par reseaux de neurones specifiques, avec une RMSmoyenne de 94 µV dans l’intervalle QT, par rapport a la regression specifique avec uneRMS moyenne de 108 µV . Au niveau de la correlation entre les derivations synthetiseeset les derivations originales, la synthese par reseaux de neurones specifiques affiche descorrelations superieures a celles de la regression specifique avec des correlations moyennesde respectivement 0.96 et 0.95 dans l’intervalle QT.

Le tableau 3.12 resume les resultats des tests statistiques effectues sur les valeurs deserreurs RMS des 4 methodes. D’apres ces resultats, seule l’approche de synthese specifique

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 98

Tab. 3.10 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation entreles derivations V1,V3. . . V6 originales et celles synthetisees par le comite de reseaux deneurones generique (ANN-G) et le modele de regression generique (REG-G) sur les ECG2 du sous-ensemble SE2 (N=35).

V1, V3. . . V6 a partir de DI, DII et V2 CardietteMethode Derivation RMS (±σ) r (±σ)

A V1 87 (± 42) .97 (±) 0.02N V3 108 (± 50) .97 (±) 0.03N V4 171 (± 77) .88 (±) 0.14- V5 152 (± 65) .91 (±) 0.09G V6 96 (± 44 .93 (±) 0.07

R V1 88 (± 42) .97 (±) 0.02E V3 111 (± 49) .96 (±) 0.04G V4 176 (± 73) .88 (±) 0.09- V5 157 (± 63) .90 (±) 0.07G V6 98 (± 45) .92 (±) 0.08

Tab. 3.11 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation entreles derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux deneurones specifiques (ANN-S) et les modeles de regression specifiques (REG-S) sur lesECG du sous-ensemble SE2 (N=35).

V1,V3. . . V6 a partir de DI, DII et V2 CardietteMethode Derivation RMS (±σ) r (±σ)

A V1 68 (± 30) .98 (±) 0.02N V3 93 (± 45) .98 (±) 0.02N V4 114 (± 45)∗ .95 (±) 0.05- V5 112 (± 42)∗∗ .95 (±) 0.04S V6 84 (± 34) .95 (±) 0.04

R V1 75 (± 33) .98 (±) 0.02E V3 99 (± 46) .97 (±) 0.02G V4 140 (± 55) .92 (±) 0.07- V5 132 (± 46) .93 (±) 0.05S V6 93 (± 40) .94 (±) 0.06

* p ≤ 0.01, ** p ≤ 10−5 (paired t-tests)

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 99

affiche une difference statistiquement significative (p< 10−6) entre les reseaux de neuroneset la regression multiple.

Tab. 3.12 – Comparaison par les t-tests (pairwised et trimmed) de la difference en termesd’erreurs RMS obtenues par les comites de reseaux de neurones et les modeles de regressiongeneriques et specifiques (N=35).

Pairwised t-test Trimmed t-testMethodesANN-G vs REG-G 0.236 0.066ANN-S vs REG-S < 10−6 < 10−7

Derivations precordiales (V1, V3. . . V6) synthetisees a partir de (DI, DII, V2)de l’ECG PEM Les resultats de l’evaluation quantitative en termes d’erreur RMS etcoefficients de correlation des derivations precordiales (V1, V3. . . V6) synthetisees a partirde (DI, DII, V2) de l’ECG PEM 2 au moyen du comite de reseaux de neurones generiqueet du modele de regression generique derives comme precedemment a partir des ECGCardiette de SE1, sont illustres dans le tableau 3.13. Ces resultats montrent une legeresuperiorite de la synthese d’ECG par reseaux de neurones generiques, avec une RMSmoyenne de 131 µV dans l’intervalle QT, par rapport la regression generique avec uneRMS moyenne de 134 µV . Au niveau de la correlation entre les derivations synthetiseeset les derivations originales, la synthese d’ECG par reseaux de neurones generiques afficheune superiorite plus nette avec une correlation moyenne de 0.92 dans l’intervalle QT, parrapport a la regression generique avec une correlation moyenne de 0.90.

L’evaluation quantitative des comites de reseaux de neurones specifiques et des modelesde regression specifiques est illustree dans le tableau 3.14. Ces resultats montrent lasuperiorite de la synthese d’ECG par reseaux de neurones specifiques, avec une RMSmoyenne de 118 µV dans l’intervalle QT, par rapport la regression specifique avec uneRMS moyenne de 126 µV . Au niveau de la correlation entre les derivations synthetiseeset les derivations originales, la synthese par reseaux de neurones specifiques affiche unecorrelation superieure a celle de la regression specifique avec une correlation moyenne derespectivement 0.93 et 0.92 dans l’intervalle QT.

Le tableau 3.15 resume les resultats des tests statistiques effectues sur les valeurs deserreurs RMS des 4 methodes. D’apres ces resultats, seule l’approche de synthese specifiqueaffiche une difference statistiquement significative (p< 0.05) entre les reseaux de neuroneset la regression multiple.

La qualite de la synthese affichee par notre approche de comites de reseaux de neu-rones ne semble pas etre globalement tres superieure a celle de l’approche traditionnellede regression lineaire, en particulier au niveau generique. Cependant, vu le fait que dansnotre etude les ECG sont enregistres suivant deux systemes d’acquisition differents :

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 100

Tab. 3.13 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation entre

les derivations V1,V3. . . V6 originales des 2eme ECG 12D de SE2 et celles synthetisees apartir des ECG PEM chronologiquement homologues par le comite de reseaux de neuronesgenerique (ANN-G) et le modele de regression generique (REG-G) (N=35).

V1,V3. . . V6 a partir de DI, DII et V2 PEMMethode Derivation RMS (±σ) r (±σ)

A V1 108 (± 49)∗ .96 (±) 0.03N V3 120 (± 59) .96 (±) 0.03N V4 169 (± 72) .88 (±) 0.14- V5 156 (± 66) .89 (±) 0.09G V6 104 (± 40) .90 (±) 0.09

R V1 113 (± 51) .95 (±) 0.03E V3 121 (± 62) .96 (±) 0.04G V4 172 (± 67) .88 (±) 0.11- V5 157 (± 64) .88 (±) 0.09G V6 105 (± 43) .89 (±) 0.09

* p ≤ 0.05 (paired t-test)

Tab. 3.14 – Erreur quadratique moyenne (RMS) en µV et coefficients de correlation entreles derivations V1,V3. . . V6 originales et celles synthetisees par les comites de reseaux deneurones specifiques (ANN-S) et les modeles de regression specifiques (REG-S) sur lesECG du sous-ensemble SE2 (N=35).

V1,V3. . . V6 a partir de DI, DII et V2 PEMMethode Derivation RMS (±σ) r (±σ)

A V1 90 (± 35)∗ .95 (±) 0.04N V3 120 (± 61) .97 (±) 0.02N V4 147 (± 69) .91 (±) 0.09- V5 132 (± 53)∗ .92 (±) 0.05S V6 99 (± 43) .91 (±) 0.09

R V1 102 (± 42) .94 (±) 0.05E V3 110 (± 50) .96 (±) 0.03G V4 164 (± 72) .89 (±) 0.10- V5 150 (± 58) .90 (±) 0.07S V6 103 (± 47) .90 (±) 0.10

* p ≤ 0.01 (paired t-test)

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 101

positionnement standard pour l’ECG 12D et positionnement Mason Likar pour l’ECGPEM et l’introduction d’un dephasage du a l’asynchronisme existant entre les horlogesd’echantillonnage des dispositifs d’enregistrement PEM et Cardiette, la difference devientplus evidente. En effet, ces contraintes ont genere une difference moyenne en termes d’er-reur RMS de 76 µV et une correlation moyenne de 0.90 entre les derivations originalesDI et DII des ECG 12D et ECG 3D chronologiquement homologues (tableau 3.9). L’effetMason-Likar sur DI est plus important que la variabilite de jour en jour de l’ECG stan-dard 12D (tableau 3.7). Par ailleurs, il convient de remarquer que les valeurs RMS et lescorrelations des derivations V1, V3. . . V6 synthetisees par les comites ANN-S a partir destraces PEM 2 sont tout a fait comparables a celles mesurees entre les traces Cardiette1 et Cardiette 2 (tableau 3.7). On peut donc penser que l’on pourrait encore ameliorerles resultats si l’on construisait des reseaux specifiques sur des ECG 12D enregistres enposition Mason-Likar.

Tab. 3.15 – Comparaison par les tests statistiques t-tests (pairwised et trimmed) de ladifference en termes d’erreurs RMS obtenues par les comites de reseaux de neurones etles modeles de regression generiques et specifiques lorsque les entrees sont des ECG PEM(N=35).

Pairwised t-test Trimmed t-testMethodesANN-G vs REG-G 0.193 0.164ANN-S vs REG-S < 0.05 < 0.03

Evaluation diagnostique sur SE2

Derivations precordiales (V1, V3. . . V6) synthetisees a partir de (DI, DII,V2) de l’ECG Cardiette 2 Le tableau 3.16 illustre le degre de concordance entre les

interpretations automatiques des ECG Cardiette originaux de SE2 (2eme enregistrement)et celles des ECG 12D synthetises par le comite de reseaux de neurones generiques etpar le modele de regression multiple generique a partir des derivations DI, DII et V2de l’ECG Cardiette original lorsqu’on considere l’interpretation des ECG Cardiette 2originaux comme etant la verite. De meme, le tableau 3.17 illustre le degre de concordanceentre l’interpretation automatique des ECG Cardiette originaux et celle des ECG 12Dsynthetises par les comites de reseaux de neurones specifiques et les modeles de regressionmultiple specifiques.

Les resultats de l’evaluation de l’impact de la synthese sur le contenu diagnostique del’ECG montrent une concordance globalement elevee entre les interpretations des ECGsynthetises et celles des ECG de reference. Les matrices de confusion sont quasimenttridiagonales, a l’exception d’un seul cas diagnostique respectivement comme presentantun risque majeur sur l’ECG 12D d’origine et un risque mineur sur les ECG de synthese

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 102

sauf pour la synthese par regression specifique ou il est classe dans la categorie risquemoyen. 31 ECG de synthese sur 37 sont diagnostiques a l’identique de l’ECG 12D original.Sur les 6 cas restants, 5 se retrouvent dans des classes adjacentes de part et d’autre dela diagonale de la matrice de confusion. Cette tridiagonalite s’explique en partie par lanature des regles d’affectation a une classe qui sont basees sur des seuils appliques a lasortie du comite de reseaux de neurones. Il suffit qu’un cas soit a la limite du seuil dedecision pour qu’un epsilon de variation des traces, donc des parametres, le fasse changerd’une categorie a l’autre. Par ailleurs, il convient de noter aussi que certains parametresde type syntaxique (tels que les amplitudes et les durees des ondes Q, R, S, R’, S’,. . . )mesures sur l’ECG sont tres sensibles a de petites variations. A titre d’exemple, en casde presence d’un morphotype de type QRS ou RS avec une toute petite onde R, unetres faible modification de l’onde R ou du niveau de la ligne de base peut conduire a desmodifications consequentes des parametres mesures (Figure 3.9).

Comme deja evoque dans le chapitre 2, l’introduction de fonctions d’appartenancefloue permettrait sans doute d’attenuer ces changements intempestifs de categorie liesaux seuils de decision utilises pour mesurer les parametres ECG de nature syntaxique(relatifs aux ondes Q, R, S,. . . ) ou pour categoriser un ECG en l’une ou l’autre desclasses de diagnostic.

(a) (b)

Fig. 3.9 – Incidence de la methode de synthese de l’ECG sur la calcul des parametresECG de type syntaxique. A gauche sur l’ECG d’origine, le trace presente une petite ondeR et une grande onde S. A droite, sur l’ECG de synthese, aspect typique dit QS. L’ondeR, microvoltee, n’a pas ete detectee et par consequent la duree de l’onde Q est passee de0 a 92 msec et celle de l’onde S de 70 msec a 0.

Derivations precordiales (V1, V3. . . V6) synthetisees a partir de (DI, DII,V2) de l’ECG PEM 2 Le tableau 3.18 illustre le degre de concordance entre lesinterpretations automatiques des ECG Cardiette 2 Originaux et celles des ECG 12Dsynthetises a partir des derivations DI, DII et V2 de l’ECG PEM chronologiquementhomologue (ECG PEM 2) par le comite de reseaux de neurones generiques et le modelede regression multiple generique, l’interpretation des ECG Cardiette 2 etant considereecomme etant la verite. De meme, le tableau 3.19 illustre le degre de concordance entreles interpretations automatiques des ECG Cardiette 2 originaux et celles des ECG 12Dsynthetises par les comites de reseaux de neurones specifiques et les modeles de regression

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 103

Tab. 3.16 – Concordance entre les interpretations des ECG originaux et celles de ECGsynthetises a partir des derivations DI, DII et V2 de l’ECG 12D Cardiette 2 par le comitede reseaux de neurones generiques (ANN-G) et par le modele de regression generique(REG-G). Le logiciel de diagnostic classe les ECG suivant 4 categories de risque : pas derisque, risque mineur, moyen et majeur.

Original pas de risque risque mineur risque moyen risque majeur(6) (15) (5) (11)

ANN-Gpas de risque (8) 6 2 0 0

risque mineur (14) 0 13 0 1risque moyen (6) 0 0 4 2risque majeur (9) 0 0 1 8

REG-Gpas de risque (7) 5 2 0 0

risque mineur (15) 1 13 0 1risque moyen (5) 0 0 4 1

risque majeur (10) 0 0 1 9

Tab. 3.17 – Meme resultats que dans le tableau 3.16, mais pour les comites de reseauxde neurones specifiques (ANN-S) et les modeles de regression specifiques (REG-S).

Original pas de risque risque mineur risque moyen risque majeur(6) (15) (5) (11)

ANN-Spas de risque (7) 5 2 0 0

risque mineur (15) 1 13 0 1risque moyen (5) 0 0 4 1

risque majeur (10) 0 0 1 9

REG-Spas de risque (6) 5 1 0 0

risque mineur (16) 1 14 1 0risque moyen (5) 0 0 3 2

risque majeur (10) 0 0 1 9

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 104

multiple specifiques.

Tab. 3.18 – Meme resultats que dans le tableau 3.16, mais pour les ECG reconstruits apartir des derivations DI, DII et V2 de l’ECG PEM 2.

Original pas de risque risque mineur risque moyen risque majeur(6) (15) (5) (11)

ANN-Gpas de risque (5) 3 1 1 0

risque mineur (12) 2 8 1 1risque moyen (13) 1 6 2 4risque majeur (7) 0 0 1 6

REG-Gpas de risque (6) 3 2 1 0

risque mineur (13) 2 9 1 1risque moyen (10) 1 4 2 3risque majeur (8) 0 0 1 7

Bien que moins probants, ces resultats sont neanmoins satisfaisants car 34 cas sur37 cas se retrouvent ici encore sur la tridiagonale de la matrice de confusion. Deux cassupplementaires montrent un changement de categorie diagnostique qui va au dela de lacategorie adjacente. Ainsi un cas passe de la categorie pas de risque a la categorie risquemoyen, un autre passe de la categorie risque moyen a la categorie pas de risque.

Comme pour l’evaluation quantitative, le fait d’avoir utilise des ECG enregistres aplusieurs minutes d’intervalle avec deux systemes d’acquisition differents, ie un position-nement des electrodes DI et DII “standard” pour l’ECG 12D et “Mason Likar” pour l’ECGPEM 3D, parfois des electrodes mal-placees. . . a pu generer des differences importantesentre les derivations originales DI et DII des ECG 12D et ECG 3D. Cette variabilite, tresimportante dans certains cas, a empeche une bonne qualite de synthese et a du altererle contenu diagnostique des ECG. Si l’on prend comme critere de qualite le pourcentagede diagnostics sans changements de categorie (ie la somme des elements de la diagonaledes matrices de confusion divisee par le nombre total de cas analyses, soit 37), ANN-Ssemble plus performant que REG-S, mais pas plus performant que ANN-G. De facon sur-prenante, la regression generique (REG-G) avec 21/37 classes a l’identique, semble etrela methode la plus performante. Ces resultats sont cependant a prendre avec precautioncar avec seulement 37 cas, l’ensemble de test n’est pas suffisamment representatif pour entirer des conclusions definitives.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 105

Tab. 3.19 – Meme resultats que dans le tableau 3.17, mais pour les ECG reconstruits apartir des derivations DI, DII et V2 de l’ECG PEM 2.

Original pas de risque risque mineur risque moyen risque majeur(6) (15) (5) (11)

ANN-Spas de risque (7) 4 2 1 0risque mineur (9) 1 6 1 1risque moyen (13) 1 7 2 3risque majeur (8) 0 0 1 7

REG-Spas de risque (8) 4 3 1 0risque mineur (7) 1 4 1 1risque moyen (14) 1 8 2 3risque majeur (8) 0 0 1 7

3.9 Discussion

Comme le demontre la figure 3.10, La qualite de reconstruction par notre methodede synthese de l’ECG 12D par comites de reseaux de neurones artificiels specifiques estexcellente compte tenu du faible nombre de derivations qui ont servi pour realiser lasynthese et le fait que les ECG ont ete enregistres dans de vraies situations cliniques, pardes techniciens differents et avec diverses configurations de positionnement des electrodes.En effet, les differences de similarite entre les ECG originaux et ceux synthetises se sontaverees principalement dues a des electrodes mal placees ou explicables par les differencesde positionnement des electrodes peripheriques selon le systeme de recueil dit de Mason-Likar versus des electrodes fixees aux extremites des membres et par consequent n’ontpas perturbe le diagnostic dans la majorite des cas. Par ailleurs, malgre le fait qu’auniveau generique, les reseaux de neurones n’ont pas depasse en performance la regressionmultiple, nous croyons que notre approche peut etre optimisee en utilisant une base dedonnees d’ECG plus grande et plus representative lors de la phase d’apprentissage.

De plus, la marge de progression reste consequente, tant au niveau des collectes d’ECGplus adaptes (au moins 3 ECG seriels. . . ) que du pretraitement des donnees, de l’opti-misation de l’apprentissage via des techniques d’apprentissage selective [96], evolutive[95]. . .

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 106

3.10 Conclusion

Dans ce chapitre, nous avons presente l’etude exhaustive d’une methode originalede synthese de l’ECG 12D par application de comites de reseaux de neurones artificielsque j’ai developpe au cours de ma these. Les evaluations quantitatives et cliniques de lamethode ont demontre son interet majeur dans le cadre d’un scenario de telemedecine :acquisition d’un ECG simplifie a domicile ou en ambulatoire, et generation de l’ECGstandard 12D correspondant.

Les performances enregistrees par la methode de reseaux de neurones sur des ECG12D seriels ou des ECG 12D et ECG PEM enregistres dans des conditions simulant cellesd’utilisation du PEM (c’est a dire en ambulatoire ou a domicile, acquisition par le patient,son entourage ou un/une aide soignant(e), avec un positionnement d’electrodes differentde celui de l’ECG standard 12D), ont largement depasse les methodes conventionnellespubliees dans la litterature. Les premiers resultats des experimentations de la methodede synthese ont ete presentes lors de la conference internationale IEEE Computers inCardiology 2004 [140]. Un deuxieme article, sur l’evaluation sur la base de donnees CHDB,a ete soumis pour publication a la revue internationale Methods of Information in Medicine[141], et un troisieme article est en cours de redaction.

Chapitre 3. Acquisition de l’ECG PEM et synthese de l’ECG standard 107

ANN − G

V1

V3

V

4

V

5

V6

ANN − S Original REG − S REG − G

Fig. 3.10 – Illustration de la qualite de synthese de l’ECG standard 12D a partir de l’ECGPEM 3D.

Chapitre 4

Mise en place de la plateformedecisionnelle du PEM

4.1 Objectifs

Dans ce chapitre, nous allons principalement exposer et traiter les problemes liees audeploiement des methodes d’intelligence artificielle abordees dans les precedents chapitres,dans la plateforme logicielle du systeme.

– Une premiere problematique est liee a la creation des modules de calcul du risquecardiovasculaire : il s’agit du module neuronal d’interpretation de l’ECG PEM, dumodule bayesien de quantification des facteurs de risque a partir des donnees dudossier medical de l’utilisateur du PEM, et de la couche de collaboration entre lesdeux modules suivant un systeme a base de regles de logique floue.

– Une deuxieme problematique est liee au deploiement du module de synthese del’ECG 12D a partir de l’ECG PEM 3D enregistre par l’utilisateur (citoyen/patient)lui-meme, avec le minimum d’assistance professionnelle.

– Une troisieme problematique est de rendre l’aide a la decision dans le systemeadaptee a la specificite de chaque utilisateur.

Les autres problematiques liees a la generation d’alarmes et de leur niveau, la gestion del’envoi des alarmes tenant compte des non-reponses eventuelles des serveurs d’alarme oudes professionnels de sante contactes. . . seront brievement abordes.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 109

4.2 Etat actuel de developpement du PEM a l’etape

de prototype

Quatre-vingt prototypes du PEM ont ete construits et evalues selon differents scenariod’utilisation dans differents centres, a Lyon, Brescia, Catania, Lund et Trento, dans desservices d’urgence, des unites de soins intensifs, des cliniques de cardiologie, en medecine deville, au domicile du patient et en ambulatoire, par differents professionnels (cardiologues,generalistes, techniciens ECG, infirmieres,. . . ) et par des patients eux-memes [7, 47].

Dans la suite de cette section, nous allons decrire les fonctionnalites et services dispo-nibles dans le PEM a l’etat actuel de developpement.

4.2.1 Le PEM : intelligence embarquee dans un environnementpervasif multi-acteurs de telemedecine citoyenne

Le projet EPI-MEDICS a developpe un PEM intelligent et pervasif pour la detectionprecoce de la survenue d’evenements cardiovasculaires chez les patients et citoyens uti-lisateurs du systeme. La plateforme decisionnelle embarquee dans le PEM permet : ladetection des arythmies, le diagnostic des ischemies, la generation d’alarmes, et la ges-tion intelligente des messages d’alarmes de maniere a assurer un acheminement securiseet dans les plus courts delais aux professionnels de sante appropries : SAMU, medecintraitant. . . (Figure 4.1)

Fig. 4.1 – Le PEM (Personal ECG monitor) au service de la prevention et la detectionprecoce de la survenue d’evenements cardiovasculaires.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 110

4.2.2 Architecture pervasive generique

Pour permettre une communication pervasive entre les acteurs de l’application (utili-sateur du PEM, SAMU, cardiologue, etc.) communiquant a l’aide de divers outils (PEM,telephone portable, PDA, etc.), EPI-MEDICS a realise une architecture generique baseesur les technologies d’Internet (TCP/IP) et le meta-language XML pour la representation,le stockage et la communication des donnees [6, 142].

L’architecture pervasive d’EPI-MEDICS (Figure 4.2) consiste en une application prin-cipale installee sur un serveur web dont le principal objectif est d’assurer la gestion del’echange des messages, et des applications clients distribuees, la communication etantsecurisee grace au protocole HTTPS. Un message contient une partie liee a la communi-cation, une copie du dossier de sante electronique, et tout autre fichier attache tel qu’unECG au format SCP-ECG. Pour assurer la bonne reception de l’information dans un delaiacceptable, l’architecture permet d’acheminer partout, differents types de notification parle biais des divers moyens et technologies de communication de l’ere actuelle (Pager, SMS,PDA, etc.).

Fig. 4.2 – Un exemple d’architecture d’EPI-MEDICS : un serveur web assure la gestionintelligente des echanges de messages, et des applications clientes distribuees servant aenvoyer et a recevoir les demandes XML de tele-expertise via HTTPS.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 111

4.2.3 Generation et gestion d’alarmes

Differents niveaux d’alarmes sont generes suivant la severite de l’evenement cardiaque :alarmes majeure, moyenne, mineure, ou pas d’alarme.

Les alarmes de niveau majeur (infarctus aigu, arythmies severes) sont transmises auSAMU ou a l’un des centres d’urgence identifies et stocke dans le PEM en utilisantBluetooth et GPRS via le telephone portable de l’utilisateur (Figure 4.3). Sont transmisen priorite :

1. un message d’alarme indiquant la cause et le degre de gravite de l’alarme ;

2. les donnees permettant d’identifier et de localiser le patient ;

3. l’ECG qui a ete la cause de la generation de l’alarme ;

4. le dossier medical du patient, notamment ses antecedents cardiaques et ses facteursde risque ;

5. l’ECG de reference (s’il existe) ;

6. un descriptif des symptomes cliniques (si le patient a eu le temps de les documenter) ;

7. l’ECG precedant l’ECG anormal (si specifie par les parametres d’envoi du patient).

Fig. 4.3 – Scenario d’alarme majeure.

Dans le cas d’une alarme de niveau moyen (suspicion d’ischemie, arythmie atypique),l’ensemble des informations (ECG PEM et le dossier medical electronique embarque) estenvoye a un serveur d’alarmes (Figure 4.4) qui envoie des reception un SMS au medecintraitant (cardiologue ou generaliste) identifie dans la liste des contacts du patient em-barquee dans le PEM. Ce SMS indique la raison et l’importance du niveau d’alarme, lenumero du telephone portable du patient, l’adresse du serveur d’alarmes (couramment :http ://pem-alarm.insa-lyon.fr ou http ://pemalarm. univ-lyon1.fr), un identifiant de 6chiffres generes aleatoirement et un mot de passe choisi aleatoirement dans un diction-naire de mots courants de 6 a 8 caracteres. Le medecin traitant peut alors se connecterau serveur d’alarmes au moyen d’Internet, visualiser l’ensemble des informations dispo-nibles pour ce patient au moyen d’un simple browser Web, et prendre les decisions qui

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 112

s’imposent : contacter le patient, requalifier le niveau d’alarme en alarme majeure endemandant au serveur d’envoyer l’ensemble des informations au SAMU, demander unetele-expertise aupres d’un confrere, copier le ou les ECGs stockes temporairement sur leserveur d’alarme dans le dossier medical du patient. . .

Fig. 4.4 – Scenario d’alarme moyenne.

Dans le cas d’une alarme de niveau mineur, le PEM affiche un message invitant l’uti-lisateur a signaler ce message a son medecin traitant a l’occasion d’une prochaine visite ason cabinet. Le contenu du message est archive dans le PEM en meme temps que l’ECGet les resultats de l’analyse quantitative et le medecin pourra par la suite telecharger etvisualiser l’ECG concerne.

Enfin, si la probabilite du risque cardiovasculaire n’est pas significative, le PEM emetun message reconfortant au patient : pas de risque, etat cardiaque normal.

4.2.4 Detection des arythmies et des ischemies

La detection des arythmies est basee sur un systeme a base de regles de logique floue.Le module d’interpretation du rythme cardiaque, concu mais pas encore implante dans lePEM, calcule les variations de l’ECG PEM par rapport a un ECG de reference. Suivantla categorie auquel correspond l’utilisateur du PEM, a savoir, athlete professionnel1, sujetsain, sujet avec des antecedents d’arythmies dans le passe, sujet souffrant de problemescardiaques, le module applique une serie de regles standards utilisees pour detecter l’aryth-mie. Ces regles originalement faites en logique booleenne ont ete traduites en logique floue

1Il est en effet connu que l’ECG d’un sportif professionnel est tres different de l’ECG d’un sujet dememe age, du meme sexe et de meme categorie diagnostique mais non sportif. En particulier, le segmentST peut presenter des decalages par rapport a la ligne de base de l’ECG avoisinant les criteres d’ischemiechez un sujet sain, sportif professionnel

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 113

pour permettre plus de flexibilite et sensibilite dans l’interpretation.

La detection des ischemies est basee sur l’utilisation de comites de reseaux de neuronesartificiels de respectivement 100 reseaux pour l’analyse unaire et 75 pour l’analyse serielle.L’analyse unaire n’est invoquee que si aucun ECG de reference n’est disponible. Lesreseaux de neurones sont representes suivant un format texte, developpe dans le cadred’EPI-MEDICS. Ce format contient la description de tous les parametres des reseaux deneurones (poids, biais, fonctions d’activation) afin de rendre possible son deploiement.Enfin, un logiciel, simulant le fonctionnement des reseaux de neurones, charge les reseauxdu comite, recupere les parametres unaires/seriels et lance l’interpretation de l’ECG PEM[143].

4.2.5 Reconstruction de l’ECG standard 12D a partir de l’ECGPEM 3D

Lors de l’enregistrement d’un ECG, le PEM peut detecter un disfonctionnement car-diaque et contacter un centre d’appel (SAMU) ou un professionnel de sante (medecintraitant). Comme nous l’avons deja explique, le PEM est concu pour envoyer l’ECG res-ponsable du declenchement de l’alarme dans un format comprehensible et interpretablepar les cardiologues, a savoir l’ECG standard 12D, encode suivant la norme SCP-ECG.Pour assurer la reconstruction de l’ECG standard, un module de synthese, base une ma-trice de transformation generique, a ete embarque dans le PEM.

Au cours du projet EPI-MEDICS, diverses approches de synthese ont ete evalueesou developpees, dont notamment la methode de reconstruction par reseaux de neuronesque j’ai developpe et presente dans ce rapport de these. Cette methode originale et tresprometteuse a ete testee sous Matlab mais n’a pas encore ete implementee dans le PEM.Une etude va etre menee pour determiner la meilleure strategie de deploiement, du fait ducout de calcul que necessite l’apprentissage de comites de reseaux de neurones a grandeechelle (tous les futurs utilisateurs du PEM). Quelques reponses sont fournies dans lasuite de ce chapitre.

4.3 Vers un produit final : strategies de deploiement

du module de synthese de l’ECG embarque dans

le PEM

D’un point de vue technique, l’integration des technologies d’analyse multivariee tellesque les reseaux de neurones dans un systeme d’aide a la decision tel que le PEM pourrealiser un module de synthese de l’ECG tend a etre couteux en termes d’espace memoire

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 114

et de temps de calcul, particulierement pendant la phase d’apprentissage des reseauxde neurones. Cependant, une fois le processus d’apprentissage realise, la synthese d’unenregistrement ECG de 10 sec ne prend qu’environ 5 sec sur un ordinateur Pentium IVde 2 GHz sous Matlab. Cette duree de traitement sera alors encore bien reduite en phaseoperationnelle en utilisant le langage C.

D’autres part, il faut savoir que l’objectif principal de la synthese d’ECG n’est pas laprise de decision dans le PEM mais plutot la reproduction la plus fidele possible d’un ECG12D correspondant a l’ECG PEM critique afin de le rendre interpretable par le cardiologuedestinataire. Dans le PEM, la reconstruction des derivations (V1, V3, . . . V6) manquantespermet de produire un enregistrement ECG compatible au standard SCP-ECG qui serastocke dans la carte memoire du PEM.

Deux types de solutions pourraient etre utilises pour realiser le module de synthesede l’ECG par reseaux de neurones, suivant notre perception de l’operabilite du PEM :systeme completement autonome ou semi autonome.

4.3.1 Le PEM, un dispositif autonome

La puissance de calcul de l’informatique embarquee a progresse enormement cettederniere decennie approchant aujourd’hui les capacites de calcul d’un Pentium III de800 MHz. Ce potentiel de calcul pourrait nous permettre de doter le PEM d’un moteurd’apprentissage des reseaux de neurones. Ce moteur utiliserait les bases de donnees d’ECGpropre a l’utilisateur du systeme pour mettre a jour le jeu de parametres des comites dereseaux de neurones specifiques.

4.3.2 Le PEM, un dispositif semi-autonome

Bien que le choix d’un dispositif completement autonome semble etre seduisant, uneetude de l’interet de l’introduction de telles puissances de calcul et surtout de son impactau niveau du prix unitaire de l’appareil, devrait etre effectuee.

Une solution moins couteuse et plus facilement evolutive au niveau materiel mais quipeut etre plus compliquee a mettre en place du point de vue logiciel, consiste a se servirdes moyens de communication integres dans le PEM (Blue Tooth, GPRS, serveur web. . . ) pour permettre la communication de donnees entre le PEM et les professionnels desante. De tels moyens permettent d’envoyer les ECG collectes par le patient a un serveurweb sur lequel chaque patient disposerait d’un dossier medical electronique ainsi que desa propre base de donnees ECG. Ces donnees peuvent etre dynamiquement mises a jouret revisees au moyen de technologies de grilles de calcul et de services web.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 115

Service web et grille de calcul : grille pervasive

La technologie service web en informatique medicale Par definition, un serviceweb est une entite logicielle concue pour permettre l’interaction fluide et transparenteentre des applications heterogenes a travers un reseau. Un service web est dote d’uneinterface decrite dans un format interpretable par les machines : le format WSDL. Les ap-plications interagissent avec le service web moyennant des messages en SOAP2, transmisvia HTTP avec une serialisation XML en conjonction avec les standards Web. L’architec-ture des services web comprend trois technologies emergentes : SOAP, WSDL3, et UDDI4.Un processus service web typique inclut :

– un fournisseur de services (provider) qui deploie les services web representant lagamme de services, applications et specificites systemes fournies par ce fournisseur,et qui seront publiees dans un registre UDDI,

– un demandeur de service (requester) qui fouille le registre a la recherche du servicerequis et pourrait par la suite etre mis en lien avec le fournisseur.

Les services web fournissent une base de reference commune pour deployer, representeret formater a la fois les entrees et les sorties des donnees des applications d’informatiquemedicale existantes.

L’apport de l’infrastructure grille de calcul L’interet majeur d’une plateformede synthese d’ECG est de permettre une application a grande echelle de l’apprentissageneuronal afin de configurer un dispositif de transformation specifique a chaque utilisa-teur du PEM. Cependant, un tel objectif n’est pas realisable sans la mise en œuvrede ressources de calcul suffisantes. D’ou l’interet de faire appel a une infrastructure abase de grille de calcul. Une grille de calcul est une infrastructure materielle et logi-cielle qui fournit un acces consistant, pervasif et non couteux a des ressources de traite-ment consequentes. Au cours des 5 dernieres annees, les outils de developpement et dedeploiement des applications de grille de calcul sont devenus de plus en plus nombreux :Legion (http ://legion.virginia.edu), Condor (http ://www.cs.wisc.edu/condor), Unicore(http ://www.unicore. org), Globus (http ://www.globus.org/toolkit) etc. Ces outils per-mettent la coordination des ressources qui ne sont pas sujet a un controle centralise enutilisant des protocoles et interfaces generiques et standards et de delivrer une qualite deservice constante.

La combinaison de ces technologies de service web et grille de calcul sous l’intitule

2SOAP (Simple Object Access Protocol) est un protocole de transmission de messages. SOAP n’estni lie a un systeme d’exploitation ni a un langage de programmation. En tant que tel, il s’agit d’unimportant composant de base pour developper des applications distribuees

3WSDL est le langage de description des services Web (Web Services Description Language). Un fichierWSDL est un document XML decrivant un ensemble de messages SOAP et la maniere dont les messagessont echanges

4UDDI (Universal Discovery Description and Integration) est l’equivalent des pages jaunes dans lesservices Web. Une entree du repertoire UDDI est constituee d’un fichier XML qui decrit une entrepriseet les services qu’elle offre.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 116

de grille pervasive suscite de plus en plus d’interet en telemedecine [144]. La figure 4.5illustre bien l’utilite d’une strategie de deploiement faisant appel a de telles technologiesdans le cadre de notre application.

Fig. 4.5 – Grille pervasive au service de la telemedecine. Inspire de David De Roure,Mobile Medical Monitoring, National e-Science Centre Talk.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 117

4.3.3 Scenario d’utilisation du module de synthese d’ECG

Moyennant la technologie des services web et l’infrastructure de grille de calcul, latache d’apprentissage des reseaux de neurones est deleguee a un service web. Ce derniers’approprie des ressources de calcul necessaires pour effectuer un apprentissage d’un co-mite de reseaux de neurones specifiques et pour renvoyer les resultats au PEM. Le modede fonctionnement envisage est le suivant (Figure 4.6) :

– Lors de la premiere utilisation du systeme et jusqu’a l’acquisition d’un ECG standardde reference, l’utilisateur enregistre un ECG 3D et l’ECG artificiel 12D correspon-dant serait synthetise a partir de l’ECG PEM en appliquant le comite de reseauxde neurones generiques stocke initialement dans le PEM.

– Le module de synthese d’ECG est mis a jour par l’ajout d’un dispositif de synthesed’ECG specifique a l’occasion d’une des visites du patient chez son cardiologue.Cette mise a jour est conditionnee par l’acquisition d’un ECG standard 12D par lecardiologue. Ce dernier accede via Internet a l’un des serveurs d’application d’EPI-MEDICS, envoie l’ECG du patient au serveur d’application qui, a l’aide d’un serviceweb, calcule et retourne un comite de reseaux de neurones specifique au patient. Eneffet, a chaque nouvelle acquisition d’ECG standard 12D, le cardiologue devraitenvoyer ces nouveaux ECG au serveur d’application pour etre stockes dans unebase de donnees propre au patient. Cette base de donnees servira ulterieurement amettre a jour a la fois les dispositifs de synthese d’ECG specifique et generique.

– En outre, meme si la synthese specifique s’est averee etre plus precise, la recons-truction par voie generique reste particulierement attrayante dans les situations oule bruit ou des artefacts sont releves sur les signaux. En effet, alors que la recons-truction specifique peut devenir davantage influencee par ce phenomene et produiredes ECG de mauvaise qualite avec un risque d’alterer le contenu diagnostique, lareconstruction generique est moins vulnerable a cet effet puisqu’elle a ete obtenuea partir d’un grand ensemble d’ECG anonymes et variables intra et inter sujets.Pour ces raisons, chaque fois que l’utilisateur du PEM acquiert un nouvel ECG,les deux dispositifs de synthese specifique et generique sont employes pour produirerespectivement deux ECG de synthese, l’un generique et l’autre specifique. Un mo-dule d’analyse de la qualite du signal devrait etre concu pour determiner le meilleurECG synthetise suivant une serie de test : par exemple, comparaison par rapport al’ECG de reference acquis par le cardiologue, etc. Ceci aiderait a eviter les erreursde diagnostic dues a une mauvaise qualite d’ECG synthetises.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 118

Fig. 4.6 – Scenario d’utilisation du module de synthese d’ECG. Le cardiologue acquiertun ECG standard 12D du patient, accede via Internet au serveur d’application qui, a l’aided’un service web, reserve les ressources necessaires, calcule et met a jour les dispositifs desynthese d’ECG par reseaux de neurones dans le PEM.

Chapitre 4. Mise en place de la plateforme decisionnelle du PEM 119

4.4 Conclusion

Dans ce chapitre, nous avons presente les aspects lies au deploiement et a la ”main-tenance” de la plateforme decisionnelle du PEM, en particulier le module neuronal d’in-terpretation de l’ECG PEM, et le module de gestion et d’envoi d’alarmes. Nous avonsegalement presente les strategies de deploiement du module de reconstruction de l’ECGpar comites de reseaux de neurones integrant des serveurs web applicatifs et des grilles decalcul. La mise en application de ce module dans le cadre d’un scenario global a grandeechelle de calcul d’une matrice de synthese specifique a chaque utilisateur du PEM seraitsans doute l’une des principales perspectives de recherche future de nos travaux.

Quatrieme partie

Conclusion generale

120

Conclusion generale

Ce memoire constitue une presentation detaillee de mes travaux de recherche au coursde 4 annees de these. Ces travaux, qui s’inscrivent dans la continuite du projet europeenEPI-MEDICS qui a pour objectif la realisation d’un moniteur personnel d’ECG (PEM),ont contribue a mettre en œuvre les modules de diagnostic automatique de l’infarctus etla synthese de l’ECG standard. Ces modules seront les fondements de la future plateformed’aide a la decision qui sera embarquee dans le PEM.

Trois domaines d’etude ont ete abordes dans cette these : le classement automatique,la fusion de donnees, et l’approximation de signaux. Pour chacune de ces parties, nouspresentons ci-apres un resume de notre contribution et quelques perspectives.

Interpretation automatique de l’ECG et fusion de

donnees

Resume

Les travaux presentes dans la premiere partie du document (chapitre 2) interviennentdans la realisation des divers modules de la plateforme intelligente d’aide a la decisionqui sera ulterieurement integree dans le PEM. Cette plateforme, basee sur l’utilisationde techniques d’intelligence artificielle, combinera a la fois l’interpretation de l’ECG dupatient et des donnees cliniques contenues dans son dossier medical personnel pour genererun score de risque d’infarctus. L’architecture fonctionnelle de la plateforme fut l’objetd’une presentation lors des Journees Sciences, Technologies et Imagerie pour la Medecinea Nancy en Mars 2005 [145].

Le module d’interpretation des ECG enregistres par l’utilisateur lui-meme etablit undiagnostic d’infarctus du myocarde par le biais des reseaux de neurones qui ont montreune performance de diagnostic elevee, comparable a celle des experts cardiologues. Cettesuperiorite des reseaux de neurones, par rapport a des approches traditionnelles telles quel’analyse discriminante, provient principalement de la combinaison de leurs resultats.

122

Le module de stratification des facteurs de risque par reseaux bayesiens permet d’es-timer le taux de risque de la survenue d’un evenement cardiovasculaire en s’appuyant surles facteurs de risque propres au patient. La performance enregistree par l’approche desreseaux bayesiens s’est averee tres prometteuse. J’ai ete invite a presenter une communi-cation orale sur les resultats du module bayesien lors du 6eme STAFF Studies Symposiumqui a ete organise par le Duke Medical Center de Durham a St Jean d’Ardieres en sep-tembre 2005. De meme, la presentation de la methode et des resultats viennent d’etreacceptes pour publication a la conference internationale IEEE Computers in Cardiology2006 [115].

Perspectives

Les perspectives d’evolution et d’amelioration des methodes presentees dans cettepartie, les reseaux de neurones et les reseaux bayesiens, sont tres nombreuses pour diversesraisons :

– d’une part liees au fait qu’il faudrait explorer de nouvelles approches d’optimisationdes methodes actuelles. En effet, la marge de progression reste consequente :

– au niveau du pretraitement des donnees (le choix de l’ACP pour les reseauxde neurones. . . ),

– et de l’optimisation de l’apprentissage neuronal via des techniques d’appren-tissage selective [96], evolutive [95], etc.

– d’autre part, lies au fait qu’il faudrait tester d’autres techniques de prediction,notamment pour le module de stratification des facteurs de risque. Les reseauxbayesiens dynamiques devraient etre testes par rapport aux reseaux bayesiens sta-tiques que nous avons utilises jusqu’a present. Mais cela est conditionne par lefait d’avoir une base de donnees dynamique ou chaque patient dispose d’un suiviregulier avec enregistrement de tous les ECG, donnees cliniques, evolution diagnos-tique dans la base de donnees. En d’autres termes, il faudrait avoir, pour le memepatient, un historique medical complet et seriel afin de pouvoir etablir une strati-fication evolutive du risque cardiovasculaire. De meme, la construction (en cours)d’une base de donnees PEM (ECG PEM, ECG standards, donnees cliniques, etc.)devrait permettre de tester differents scenarios d’interaction entre les classifieursgrace a la mise en œuvre d’algorithmes de logique floue pour maximiser la sensibi-lite d’interpretation du systeme tout en conservant une specificite elevee.

Enfin, la validation des diverses methodes et techniques developpees au cours de cettethese necessitent d’effectuer des evaluations cliniques consequentes pour s’assurer de laqualite des algorithmes mis en place, evaluations qui sont de fait freinees par l’absencede bases de donnees dans ce domaine. Une premiere etape d’evaluation va etre effectueesur une serie de bases de donnees a laquelle nous avons recemment eu acces (BUSSEL-TON [146], MRACS [147]). Ulterieurement, les methodes et algorithmes developpes etimplementes dans le systeme vont faire l’objet d’une experimentation pilote et d’uneevaluation clinique en region Rhone-Alpes dans le cadre du projet SIPIRA (SystemeIntegre Pervasif Intelligent de suivi de patients cardiaques en region Rhones-Alpes), etc.

123

Synthese de l’ECG par comites de reseaux de neurones

Resume

L’autre apport de cette these est le developpement d’une methode originale et per-formante permettant la synthese de l’ECG standard 12 derivations a partir d’un ECGsimplifie enregistre par le patient. Les evaluations effectuees sur une population d’etudede 300 patients de la base de donnees de Lund ont montre une amelioration de plus de 15%en qualite de signal par rapport aux methodes lineaires preconisees par la litterature. Lesresultats de cette experimentation ont ete presentes a la conference internationale IEEEComputers in Cardiology en septembre 2004 [140]. La deuxieme etape d’evaluation, diag-nostique, sur la base de donnees de Lund est prevue pour publication. La troisieme etaped’evaluation sur la base de donnees CHDB (ECG PEM 3D et ECG standard 12D) a etesoumise pour publication dans la revue internationale Methods of Information in Medi-cine [141]. Cette derniere phase d’evaluation de la methode de synthese par reseaux deneurones sur des ECG 12D seriels ou des ECG PEM enregistres dans des conditions si-mulant celles d’utilisation du PEM (c’est a dire en ambulatoire ou a domicile, acquisitionpar le patient, son entourage ou une aide soignante, avec un positionnement d’electrodesdifferent de celui de l’ECG standard 12D), a montre une performance largement superieurea celle de la litterature.

Perspectives

L’approche de reconstruction que j’ai developpee a prouve son efficacite. La prochaineetape consistera a proceder au deploiement de la methode dans le PEM et a prevoirl’infrastructure necessaire pour realiser l’apprentissage neuronal a grande echelle, a savoirle recours aux technologies des services web et grilles de calcul.

Le mot de la fin

L’objectif de cette these a ete de contribuer a la conception et la realisation d’un moni-teur personnel d’ECG (PEM) capable de detecter les dysfonctionnements cardiaques, degerer des alarmes et de transmettre les informations relatives a l’utilisateur du systeme (ci-toyen/patient) aux services de sante concernes. L’ensemble des travaux qui a ete presentedans cette these est motive par la volonte de developper un outil efficace de preventionqui pourrait reduire la mortalite et la morbidite liees a la survenue d’evenements car-diovasculaires en reduisant le temps separant l’apparition des symptomes et le debutdes traitements. Nous esperons que cette etude servira a stimuler la recherche dans cedomaine.

Bibliographie

[1] “World health statistics 2006,” World Health Organization, Tech. Rep., 2006.

[2] “Recommendations of a Task Force of the European Society of Cardiology and theEuropean Resuscitation Council on The Pre-Hospital Management of Acute HeartAttacks,” Eur Heart J, vol. 19, pp. 1140–64, 1998.

[3] J. McMurray et al., “Cardiology–I : Treatment of myocardial infarction, unstableangina, and angina pectoris,” BMJ, vol. 309, no. 6965, pp. 1343–50, 1994.

[4] R. Luepker, “Delay in acute myocardial infarction : why don’t they come to thehospital more quickly and what can we do to reduce delay ?” Am Heart J, vol. 150,no. 3, pp. 368–70, 2005.

[5] A. McGinn, D. Goff, H. Taylor, et al., “Trends in prehospital delay time and useof emergency medical services for acute myocardial infarction : experience in 4 UScommunities from 1987-2000,” Am Heart J, vol. 150, no. 3, pp. 392–400, 2005.

[6] P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al., “New paradigms in tele-medicine : ambient intelligence, wearable, pervasive and personalized,” Stud HealthTechnol Inform, vol. 108, pp. 123–32, 2004.

[7] P. Rubel, J. Fayn, S. Arod, H. Atoui, D. Telisson, et al., “Intelligence Ambiante etSystemes Pervasifs en Telemedecine. Exemples d’Applications en Telecardiologie,”La Revue des SAMU, vol. 26, pp. 521–526, 2004.

[8] “Myocardial Infarction redefined - A concensus document of the joint European So-ciety of Cardiology / American College of Cardiology Committee for the redefinitionof myocardial Infarction,” Eur Heart J, vol. 21, pp. 1502–1513, 2000.

[9] S. Smith, S. Blair, R. Bonow, L. Brass, et al., “AHA/ACC Guidelines for PreventingHeart Attack and Death in Patients With Atherosclerotic Cardiovascular Disease :2001 update. A statement for healthcare professionals from the American HeartAssociation and the American College of Cardiology,” J Am Coll Cardiol, vol. 38,no. 5, pp. 1581–3, 2001.

[10] H. McGill, C. McMahan, E. Herderick, et al., “Obesity accelerates the progressionof coronary atherosclerosis in young men,” Circulation, vol. 105, no. 23, pp. 2712–8,2002.

BIBLIOGRAPHIE 125

[11] L. Goldstein, R. Adams, M. Alberts, L. Appel, et al., “Primary prevention of ische-mic stroke : a guideline from the American Heart Association/American StrokeAssociation Stroke Council,” Circulation, vol. 113, no. 4, pp. 873–923, 2006.

[12] J. Salonen, G. Alfthan, J. Huttunen, J. Pikkarainen, et al., “Association betweenCardiovascular Death and Myocardial Infarction and Serum Selenium in a Matched-pair Longitudinal Study,” Lancet, vol. 24, pp. 175–179, July 1982.

[13] A. Kadish, A. Buxton, H. Kennedy, B. Knight, et al., “ACC/AHA clinical com-petence statement on electrocardiography and ambulatory electrocardiography : Areport of the ACC/AHA/ACP-ASIM task force on clinical competence (ACC/AHAcommittee to develop a clinical competence statement on electrocardiography andambulatory electrocardiography) endorsed by the International Society for Holterand noninvasive electrocardiology,” Circulation, vol. 104, no. 25, pp. 3169–78, 2001.

[14] J. Alpert, K. Thygesen, E. Antman, et al., “Myocardial infarction redefined–aconsensus document of The Joint European Society of Cardiology/American Col-lege of Cardiology Committee for the redefinition of myocardial infarction,” J AmColl Cardiol, vol. 36, no. 3, pp. 959–969, 2000.

[15] B. McCarthy, J. Beshansky, et al., “Missed diagnoses of acute myocardial infarctionin the emergency department : Results from a multicenter study,” Ann Emerg Med,vol. 22, pp. 579–582, 1993.

[16] R. Puleo, D. Meyer, C. Wathen, C. Tawa, et al., “Use of a rapid assay of subformsof creatine kinase MB to diagnose or rule out acute myocardial infarction,” N EnglJ Med, vol. 331, pp. 561–566, 1994.

[17] R. Roberts et al., “Earlier diagnosis and treatment of acute myocardial infarctionnecessitates the need for a ”new diagnostic mind set”,” Circulation, vol. 89, pp.872–881, 1994.

[18] J. Pope, T. Aufderheide, R. Ruthazer, R. Woolard, et al., “Missed diagnoses of acutecardiac ischemia in the emergency department,” N Engl J Med, vol. 342, no. 16, pp.1163–1170, 2000.

[19] H. Koukkunen, K. Pyorala, et al., “Low-risk patients with chest pain and withoutevidence of myocardial infarction may be safely discharged from emergency depart-ment,” Eur Heart Journal, vol. 25, pp. 329–334, 2004.

[20] C. Swap et al., “Value and Limitations of Chest Pain History in the Evaluation ofPatients With Suspected Acute Coronary Syndromes,” JAMA, vol. 294, pp. 2623–2629, 2005.

[21] J. Willems, P. Arnaud, J. van Bemmel, R. Degani, et al., “Common standardsfor quantitative electrocardiography : goals and main results. CSE working party,”Methods Inf Med, vol. 29, no. 4, pp. 289–97, 1990.

BIBLIOGRAPHIE 126

[22] M. Ohlson, H. Ohlin, S. Wallerstedt, et al., “Usefulness of Serial Electrocardiogramsfor Diagnosis of Acute Myocardial Infarction,” Am J Cardiol, vol. 88, no. 5, pp. 478–481, 2001.

[23] P. Rubel, J. Fayn, et al., “State of the art of automated and serial ECG analysis,”Information Society Technologies Programme, Tech. Rep. D2.1, 2001.

[24] P. Arnaud, P. Rubel, D. Morlet, J. Fayn, et al., “Methodology of ECG Interpretationin the Lyon Program,” Methods Inf Med, vol. 24, no. 4, pp. 393–402, 1990.

[25] J. Willems, C. Abreu-Lima, P. Arnaud, et al., “The diagnostic performance of com-puter programs for the interpretation of electrocardiograms,” N Engl J Med, vol.325, no. 25, pp. 1767–73, 1991.

[26] J. Fayn et al., “Caviar, a Serial ECG Processing System for the Comparative Ana-lysis of VCGs and their Interpretation with Auto-reference to the Patient,” J Elec-trocardiol, no. 21, pp. 173–176, 1988.

[27] J. Fayn, “L’analyse sequentielle des electrocardiogrammes. une approche par com-paraison optimale d’images filaires spatio-temporelles,” Ph.D. dissertation, INSA deLyon, 1990.

[28] P. Macfarlane, “Computer Processing of the 12-Lead ECG,” Cardiac Electrophysio-logy Review, vol. 1, no. 3, pp. 296–301, 1997.

[29] L. Dowdy, G. Wagner, Y. Birnbaum, P. Clemmensen, et al., “Early repolarization :friend or foe ?” Am J Med, vol. 115, no. 3, pp. 237–40, 2003.

[30] J. Healy, “Editorial of the special health and the Internet for all,” Int J Med Inform,vol. 75, no. 1, 2006.

[31] A. Bynum, C. Cranford, C. Irwin, et al., “Effect of telemedicine on patients’ diag-nosis and treatment,” J Telemed Telecare, vol. 12, no. 1, pp. 39–43, 2006.

[32] J. Fayn, C. Ghedira, D. Telisson, et al., “Towards New Integrated Information andCommunication Infrastructures in eHealth. Examples from Cardiology,” in IEEEComputers in Cardiology, A. Murray, Ed., vol. 30, 2003, pp. 113–16.

[33] C. Massone, H. Soyer, R. Hofmann-Wellenhof, et al., “Two years’ experience withWeb-based teleconsulting in dermatology,” J Telemed Telecare, vol. 12, no. 2, pp.83–7, 2006.

[34] J. Ameen, A. Coll, et al., “Impact of tele-advice on community nurses’ knowledgeof venous leg ulcer care,” J Adv Nurs, vol. 50, no. 6, pp. 583–94, 2005.

[35] J. Fayn, F. Petitjean, et al., “Macro-data : a new approach for the development oftele-expertise applications,” in IEEE Computers in Cardiology, vol. 26, 1999, pp.41–4.

BIBLIOGRAPHIE 127

[36] V. Rialle, N. Noury, et al., “An experimental health smart home and its distributedinternet-based information and communication system : first steps of a researchproject,” in Medinfo, vol. 10, no. 2, 2001, pp. 1479–83.

[37] J. Thomesse, D. Belot, A. Boyer, et al., “Integrated information technologies forpatients remote follow up and homecare,” in HealthCom, 2001, pp. 3–15.

[38] P. Rubel, J. Willems, C. Zywietz, J. Fayn, et al., Health in the New CommunicationsAge. IOS Press, 1995, vol. 24, ch. OEDIPE. Open European Data Interchange andProcessing for Electrocardiography, pp. 313–321.

[39] Health in the New Communications Age. IOS Press, Amsterdam, 1995, vol. 24.

[40] J. van Bemmel, A. van Ginneken, H. Stam, et al., “Integration and communicationfor the continuity of cardiac care (i4c),” J Electrocardiol, vol. 31, pp. 60–8, 1998.

[41] J. van Bemmel, Handbook of Medical Informatics. Springer, New York, 2002.

[42] P. Rubel et al., “Protocole de communications standard pour l’electrocardiographiequantitative,” Informatique et Sante, vol. 4, pp. 45–55, 1991.

[43] “Medical informatics standard communication protocol-computer-assisted electro-cardiography (SCP-ECG),” ENV, Tech. Rep. 1064, 1993.

[44] J. Willems, P. Rubel, et al., “Standard interchange for computerized electrocardio-graphy,” Stud Health Technol Inform, vol. 6, pp. 185–94, 1993.

[45] P. Rubel, J. Willems, et al., “Development of a conceptual reference model for digitalECG data storage,” in IEEE Computers in Cardiology, vol. 18, 1991, pp. 109–12.

[46] P. Rubel, J. Willems, C. Zywietz, et al., “Towards open data interchange and pro-cessing of serial ECGs,” in IEEE Computers in Cardiology, vol. 19, 1992, pp. 79–82.

[47] P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, et al., “Toward personal eHealth incardiology. Results from the EPI-MEDICS telemedicine project,” J Electrocardiol,vol. 38, pp. 100–106, 2005.

[48] E. Harold et al., XML in a Nutshell, Third Edition. OReilly Media, Paris, 2004.

[49] E. Berner, Clinical Decision Support Systems : Theory and Practice. Springer, NY,1998.

[50] J. Haton, N. Bouzid, F. Charpillet, et al., Le raisonnement en intelligence artificielle.InterEditions, Paris, 1991.

[51] A. Jain, R. Duin, et al., “Statistical Pattern Recognition : a review,” IEEE TransPattern Anal Mach Intell, vol. 22, pp. 4–37, 2000.

[52] C. Bishop, Neural Networks for Pattern Recognition. Oxford University Press,Oxford, 1996.

BIBLIOGRAPHIE 128

[53] B. Kirkwood et al., Essential Medical Statistics. Blackwell Science, UK, 2003.

[54] G. McLachlan, Discriminant Analysis and Statistical Pattern Recognition. WileyInterscience, Canada, 2004.

[55] H. Bengtsson, “Bayesian Networks : a Self-contained Introduction with Implementa-tion Remarks,” Mathematical Statistics, Lund Institute of Technology, Tech. Rep.,1999.

[56] G. Luger, Artificial Intelligence : Structures and Strategies for Complex ProblemSolving. Addison Wesley, 2004.

[57] A. Sharkey et al., “Diversity, Selection and Ensembles of Artificial Neural Nets,”in Proceedings of Third International Conference on Neural Networks and theirApplications, Marseille, France, March 1997, pp. 205–212.

[58] J. Bailey, A. Berson, H. Handelsman, et al., “Utility of Current Risk StratificationTests for Predicting Major Arrhythmic Events After Myocardial Infarction,” JACC,vol. 38, no. 7, pp. 1902–11, 2001.

[59] A. D. Timmis, “Early diagnosis of acute myocardial infarction,” BMJ, vol. 301, pp.941–942, 1990.

[60] A. Timmis, “Will serum enzymes and other proteins find a clinical application inthe early diagnosis of myocardial infarction ?” Br Heart J, vol. 71, pp. 309–310,1994.

[61] H. Lee, S. Cross, P. Garthwaite, A. Dickie, I. Ross, et al., “Comparison of the valueof novel rapid measurement of myoglobin, creatine kinase, and creatine kinase-MBwith the electrocardiogram for the diagnosis of acute myocardial infarction,” BrHeart J, vol. 71, pp. 311–315, 1994.

[62] J. Mair, J. Smidt, P. Lechleitner, F. Dienstl, et al., “A decision tree for the earlydiagnosis of acute myocardial infarction in nontraumatic chest pain patients athospital admission,” Chest, vol. 108, pp. 1502–1509, 1995.

[63] L. Jeanpierre et al., “Automated medical diagnosis with fuzzy stochastic models :monitoring chronic diseases,” Acta Biotheor, vol. 52, no. 4, pp. 291–311, 2004.

[64] D. Bellot, “Fusion de donnees avec des reseaux bayesiens pour la modelisation dessystemes dynamiques et son application en telemedecine,” Ph.D. dissertation, Uni-versite Nancy1, 2002.

[65] P. Lisboa, Artificial neural networks in biomedicine. Springer-Verlag, London, 2000.

[66] W. Baxt, “Use of an artificial neural network for the diagnosis of myocardial infarc-tion,” Ann Intern Med, vol. 115, no. 11, pp. 843–848, 1991.

BIBLIOGRAPHIE 129

[67] R. Harrison, S. Marshall, et al., “The early diagnosis of heart attacks : a neuro-computational approach,” in International Joint Conference on Neural Networks,vol. 1, 1991, pp. 1–5.

[68] R. Kennedy, R. Harrison, A. Burtonc, et al., “An artificial neural network systemfor diagnosis of acute myocardial infarction (AMI) in the accident and emergencydepartment : evaluation and comparison with serum myoglobin measurements,”Comput Methods Programs Biomed, vol. 52, pp. 93–103, 1997.

[69] W. Baxt, F. Shofer, F. Sites, et al., “A neural computational aid to the automateddiagnosis of acute myocardial infarction,” Ann Emerg Med, vol. 34, pp. 366–373,2002.

[70] B. Heden, H. Ohlin, R. Rittner, et al., “Acute myocardial infarction detected in the12-lead ECG by artificial neural networks,” Circulation, vol. 96, no. 6, pp. 1798–1802, 1997.

[71] K. Gurney, An Introduction to Neural Networks. 1st ed. UCL Press, London, 1997.

[72] F. Rosenblatt, Principles of Neurodynamics. Spartan Press, Washington D.C.,1961.

[73] L. Fausett, Fundamentals of Neural Networks. Prentice Hall, Englewood Cliffs,NJ, 1994.

[74] T. Kohonen, Self-Organizing Maps. Springer, Berlin, 1995.

[75] J. Hopfield, “Neural networks and physical systems with emergent collective com-putational abilities,” in National Academy of Sciences, vol. 79, 1982, pp. 2554–2558.

[76] D. Rumelhart, G. Hinton, et al., “Learning internal representations by error propa-gation,” in Parallel Data Processing, vol. 1. The M.I.T. Press, Cambridge, MA,1986, pp. 318–362.

[77] L. Hansen et al., “Neural network ensembles,” IEEE Trans Pattern Anal MachIntell, vol. 12, pp. 993–1001, 1990.

[78] A. Krogh et al., “Neural network ensembles, cross validation, and active learning,”in Adv Neural Inf Process Syst, G. Tesauro, D. Touretzky, et al., Eds., vol. 2, 1995,pp. 650–659.

[79] D. Opitz et al., “Popular ensemble methods : An empirical study,” Journal of Ar-tificial Intelligence Research, vol. 11, pp. 169–198, 1999.

[80] A. Sharkey, “On combining artificial neural nets,” Connection Science, vol. 8, pp.299–314, 1996.

[81] L. Breiman, “Bagging predictors,” Machine Learning, vol. 24, no. 2, pp. 123–140,1996.

BIBLIOGRAPHIE 130

[82] Y. Freund et al., “Experiments with a new boosting algorithm,” in InternationalConference on Machine Learning, 1996, pp. 148–156.

[83] Y. Liu, X. Yao, et al., “Evolutionary ensembles with negative correlation learning,”IEEE Transactions on Evolutionary Computation, vol. 4, no. 3, pp. 295–304, 2000.

[84] B. Rosen, “Ensemble learning using decorrelated neural networks,” ConnectionScience, vol. 8, pp. 373–384, 1996.

[85] A. Sharkey, “Combining Artificial Neural Nets : Ensemble and Modular Multi-NetSystems,” in Multi-Net Systems. Springer-Verlag, 1999, pp. 1–30.

[86] C. Papaloukas, D. Fotiadis, A. Likas, et al., “An ischemia detection method basedon artificial neural networks,” Artif Intell Med, vol. 24, pp. 167–178, 2002.

[87] D. Marquardt, “An algorithm for least-squares estimation of nonlinear parameters,”Journal of the Society for Industrial and Applied Mathematics, vol. 11, no. 2, pp.431–441, 1963.

[88] P. Gill, W. Murray, et al., “The Levenberg-Marquardt Method,” in Practical Opti-mization. Academic Press, 1981, pp. 136–137.

[89] A. Jerebko, R. Summers, J. Malley, M. Franaszek, et al., “Computer-assisted de-tection of colonic polyps with CT colonography using neural networks and binaryclassification trees,” Med Phys, vol. 30, no. 1, pp. 52–60, 2003.

[90] A. Jerebko, J. Malley, M. Franaszek, et al., “Multiple Neural Network ClassificationScheme for Detection of Colonic Polyps in CT Colonography Data Sets,” AcadRadiol, vol. 10, pp. 154–160, 2003.

[91] J. Ellenius, T. Groth, B. Lindahl, et al., “Early assessment of patients with sus-pected acute myocardial infarction by biochemical monitoring and neural networkanalysis,” Clin Chem, vol. 43, no. 10, pp. 1919–25, 1997.

[92] P. Warrick, E. Hamilton, et al., “Neural Network Based Detection of Fetal HeartRate Patterns,” in IEEE International Joint Conference on Neural Networks(IJCNN), vol. 4, 2005, pp. 2400–2405.

[93] D. Bates et al., “Improving safety with information technology,” N Engl J Med, vol.348, no. 25, pp. 2526–34, 2003.

[94] E. Vonk, L. Jain, et al., Automatic Generation of Neural Network Architecture UsingEvolutionary Computation. World Scientific Publishing Co., Singapore, 1997.

[95] H. Haraldsson et al., “A New Learning Scheme for Neural Network Ensembles,”2004, submitted to IEEE Trans Neural Netw.

[96] Z. Zhou, J. Wu, W. Tang, et al., “Selectively Ensembling Neural Classifiers,” inInternational Joint Conference on Neural Networks, vol. 2, 2002, pp. 1411–1415.

BIBLIOGRAPHIE 131

[97] G. Diamond et al., “Analysis of probability as an aid in the clinical diagnosis ofcoronary-artery disease,” N Engl J Med, vol. 300, pp. 1350–1358, 1979.

[98] P. Szolovits, “Uncertainty and decisions in medical informatics,” Methods Inf Med,vol. 34, pp. 111–21, 1995.

[99] C. Kahn, “Artificial intelligence in radiology : decision support systems,” Radiogra-phics, vol. 14, pp. 849–861, 1994.

[100] C. Lagor, D. Aronsky, M. Fiszman, et al., “Automatic identification of patients eli-gible for a pneumonia guideline : comparing the diagnostic accuracy of two decisionsupport models.” in Medinfo, vol. 10, no. 1, 2001, pp. 493–7.

[101] D. Luciani, M. Marchesi, et al., “The role of Bayesian Networks in the diagnosis ofpulmonary embolism,” J Thromb Haemost, vol. 1, no. 4, pp. 698–707, 2003.

[102] C. Twardy, A. Nicholson, K. Korb, et al., “Data mining cardiovascular Bayesiannetworks,” Health Data Mining Workshop, Univ. of South Australia, 2005.

[103] F. Gueyffier, F. Boutitie, J. Boissel, et al., “INDANA : a meta-analysis on individualpatient data in hypertension. Protocol and preliminary results,” Therapie, vol. 50,no. 4, pp. 353–362, 1995.

[104] T. Stephenson, “An Introduction to Bayesian Network Theory and Usage,” IDIAP,”Research Report 00-03, 2000.

[105] F. Jensen et al., “Optimal Junction Trees,” in Proceedings of the 10th Conferenceon Uncertainty in Artificial Intelligence, July 1994.

[106] F. Jensen, An Introduction to Bayesian Networks. UCL Press Ltd, London, 1996.

[107] C. Huang et al., “Inference in Belief Networks : A Procedural Guide,” InternationalJournal of Approximate Reasoning, vol. 15, pp. 225–263, 1996.

[108] J. Bilmes, “A Gentle Tutorial of the E.M. Algorithm and its Application to Para-meter Estimation for Gaussian Mixture and Hidden Markov Models,” InternationalComputer Science Institute, Berkeley California, Tech. Rep., 1998.

[109] A. Dempster, N. Laird, et al., “Maximum Likelihood from Incomplete Data via theE.M. Algorithm,” J R Stat Soc, vol. Ser.B 39, no. 1, pp. 1–38, 1977.

[110] I. Colombet, A. Ruelland, G. Chatellier, et al., “Models to Predict CardiovascularRisk : Comparison of CART, Multilayer Perceptron and Logistic Regression,” inAMIA Symposium, 2000, pp. 156–160.

[111] B. Wielinga, G. Schreiber, et al., “KADS : a modelling approach to knowledgeengineering. In Knowledge Acquisition,” Knowledge Acquisition, vol. 4, pp. 136–145, 1992.

[112] C. Vogel, Genie Cognitif. Masson, Paris, 1988.

BIBLIOGRAPHIE 132

[113] J. Quinlan, P. Compton, et al., Inductive knowledge acquisition : A case study.Turing Institute Press, Glascow, 1987.

[114] J. Ganascia, “EKAW 90 Tutorial Notes : Machine Learning,” in Proceedings of the3rd European Workshop on Knowledge Acquisition for Knowledge-Based Systems(EKAW 89), 1989, pp. 287–296.

[115] H. Atoui, J. Fayn, F. Gueyffier, et al., “Cardiovascular Risk Stratification in De-cision Support Systems, A Probabilistic Approach. Application to pHealth,” 2006,accepted for publication in IEEE Computers in Cardiology.

[116] L. Zadeh, “Fuzzy logic, neural networks, and soft computing,” Communications ofthe ACM, vol. 37, pp. 77–83, 1994.

[117] B. Bouchon-Meunier, La logique floue. Presses Universitaires France, 1994.

[118] F. Chevrie et al., “La logique floue,” Institut Schneider Formation,” Cahier Tech-nique Schneider n 191, 1998.

[119] S. Nelwan, “Evaluation of 12-Lead ECG Reconstruction Methods for Patient Mo-nitoring,” Ph.D. dissertation, Erasmus Universiteit Rotterdam, 2005.

[120] J. Scherer, J. Jenkins, et al., “Synthesis of the 12-lead electrocardiogram from a 3-lead subset using patient-specific transformation vectors. An algorithmic approachto computerized signal synthesis,” J Electrocardiol, vol. 22, pp. 128–136, 1989.

[121] S. Nelwan, J. Kors, S. Meij, et al., Reconstruction of the 12-Lead ECG using ReducedLead Sets for Patient Monitoring. Leiden : Einthoven Foundation, 2002, pp. 545–551.

[122] R. Modre, M. Seger, G. Fischer, et al., “Cardiac anisotropy : is it negligible regardingnoninvasive activation time imaging ?” IEEE Trans Biomed Eng, vol. 53, no. 4, pp.569–580, 2006.

[123] R. Gulrajani, “The forward and inverse problems of electrocardiography,” IEEEEng Med Biol Mag, vol. 17, no. 5, pp. 84–101, 1998.

[124] J. Scherer et al., “Evaluation of 12-Lead ECG Synthesis using Analysis Measurmentsin 240 Patients,” in IEEE Computers in Cardiology, 1992, pp. 91–4.

[125] S. Adami, D. Assanelli, F. Comba, J. Fayn, R. Gatta, et al., “EPI-MEDICS SystemSpecification and Design,” Information Society Technologies Programme, Tech. Rep.D3.1, 2001.

[126] S. Adami, J. Fayn, F. Gouaux, M. Ohlson, L. Simon-Chautemps, et al., “EPI-MEDICS System Revisions,” Information Society Technologies Programme, Tech.Rep. D7.1, 2003.

BIBLIOGRAPHIE 133

[127] J. Scherer et al., “Synthesis of the 12-Lead Electrocardiogram from a 3-Lead Semi-orthogonal Subset using Patient-specific Transformation Arrays,” in IEEE Compu-ters in Cardiology, 1988, pp. 149–151.

[128] S. Nelwan, J. Kors, S. Meij, J. van Bemmel, et al., “Reconstruction of the 12-leadelectrocardiogram from reduced lead sets,” J Electrocardiol, vol. 37, no. 1, pp. 11–18,2004.

[129] R. Duin, “Learned from Neural Networks,” in ASCI 2000, Sixth Annual Conferenceof the Advanced School for Computing and Imaging, 2000, pp. 9–13.

[130] S. Mitra, S. Pal, et al., “Data Mining in Soft Computing Framework : A Survey,”IEEE Trans Neural Netw, vol. 13, no. 1, pp. 3–14, 2001.

[131] K. Hornik, M. Stinchcombe, et al., “Multilayer feedforward networks are universalapproximators,” Neural Netw, vol. 2, no. 359-366, 1989.

[132] K. Funahashi, “On the Approximate Realization of Continuous Mappings by NeuralNetworks,” Neural Netw, vol. 2, pp. 183–192, 1989.

[133] J. Castro, C. Mantas, et al., “Neural networks with a continuous squashing functionin the output are universal approximators,” Neural Netw, vol. 13, no. 6, pp. 561–3,2000.

[134] P. Macfarlane, “Age, sex, and the ST amplitude in health and disease,” J Electro-cardiol, vol. 34, pp. 235–41, 2001.

[135] M. Krucoff, “Electrocardiographic monitoring and coronary occlusion. Fingerprintpattern analysis in dimensions of space, time, and mind,” J Electrocardiol, vol. 22,pp. 232–7, 1989.

[136] G. Nollo, P. Rubel, J. Fayn, D. Assanelli, M. Crotti, et al., “PEM device andEPI-MEDICS telemedical architecture final assessment report,” Information SocietyTechnologies Programme, Tech. Rep. D6.1, 2004.

[137] “The CSE Party : Recommendations for measurement standards in quantitativeelectrocardiography,” Eur Heart J, vol. 6, pp. 815–825, 1985.

[138] M. Moller, “A scaled conjugate gradient algorithm for fast supervised learning,”Neural Netw, vol. 6, pp. 525–533, 1993.

[139] S. Orfanidis, Optimum Signal Processing. An Introduction. 2nd Edition. Prentice-Hall, Englewood Cliffs, NJ, 1996.

[140] H. Atoui, J. Fayn, et al., “A Neural Network Approach for Patient-Specific 12-Lead ECG Synthesis in Patient Monitoring Environments,” in IEEE Computers inCardiology, A. Murray, Ed., vol. 31, 2004, pp. 161–164.

BIBLIOGRAPHIE 134

[141] H. Atoui et al., “A Novel Neural Network Model for Deriving Standard 12-lead ECGsfrom serial 3-lead ECGs. Application to Self Care,” 2006, submitted to Methods InfMed.

[142] D. Telisson, J. Fayn, et al., “Design of a Tele-Expertise Architecture Adapted toPervasive Multi-Actor Environments. Application to eCardiology,” in IEEE Com-puters in Cardiology, A. Murray, Ed., vol. 31, 2004, pp. 749–752.

[143] L. Simon-Chautemps, S. Arod, S. Adami, J. Fayn, C. Malossi, et al., “Final Proto-type,” Information Society Technologies Programme, Tech. Rep. D7.2, 2004.

[144] P. Gouvas, G. Magiorkinis, A. Bouras, D. Paraskevis, et al., “Web Service-EnabledGrid-Based Platform for Drug Resistance Management,” in Panhellenic Conferenceon Informatics, vol. 3746, 2005, pp. 469–479.

[145] H. Atoui, D. Telisson, et al., “Detection precoce d’evenements cardiaques en self-care. Architecture fonctionnelle de la plateforme d’aide a la decision par reseaux deneurones du projet europeen EPI-MEDICS.” in Journees Sciences, Technologies etImagerie pour la Medecine, Nancy, 2005, pp. 13–14.

[146] M. Knuiman, H. Vu, et al., “Multivariate risk estimation for coronary heart disease :the Busselton health study,” New Zealand Journal of Public Health, vol. 22, pp. 747–753, 1998.

[147] “The MRACS study. URL http ://www.rcbweb.co.uk.”

Cinquieme partie

Annexes

135

Annexe A

Dossier Medical Personnel embarquedans le PEM

A.1 Contenu du dossier de sante du patient

Ce dossier sera enregistre dans la ” Data Card ” du PEM (PEM Card) et sera consul-table/modifiable au moyen d’un navigateur Internet standard (connexion par RS232C ouBluetooth a un PC, un MAC ou un Palmtop). Par defaut, une donnee non renseignee seramarquee ” Non Renseignee ” (NR). Lorsque l’on remplit le dossier, et que l’on ne sait pasrenseigner la donnee, on pourra utiliser le terme : ” inconnu ” (I). Des exemples d’itemspour lequel on pourra utiliser le terme inconnu sont : le sexe, le diabete, la localisationdes stenoses, etc.

A.2 Donnees demographiques

Cette section ne contient que les donnees utiles au professionnel de sante lorsqu’ilentreprend de visualiser et/ou de mettre a jour le dossier de sante du patient. Les donneesdemographiques completes (avec adresse, numeros de telephone, description des contactsetc.) sont indiquees dans la section ”contacts”.

– Nom

– Prenom

– Date de naissance : JJ/MM/AAA ou Age (ans)

– Poids (Kg)

– Taille (cm)

– Sexe : (M, F, I)

Annexe A. Dossier Medical Personnel embarque dans le PEM 137

A.3 Resultats d’analyses biologiques

– Cholesterol total (mg/dl)

– Cholesterol HDL (mg/dl)

– Cholesterol LDL (mg/dl)

– Fibrinogenes (mg/dl)

– Triglycerides (mg/dl)

– Glycemie (mg /dl)

– Nbre de leucocytes (109/l)

– Creatinemie (µmol/l)

– Enzymes hepatiques ALAT (SGPT) (U/l)

– Enzymes hepatiques ASAT (SGOT) (U/l)

– Hormone thyroıdienne T3 (µg/dl)

– Hormone thyroıdienne T4 (Thyroxine) (µg/dl)

– Hormone thyroıdienne TSH (Thyroid-Stimulating Hormone) (mili U/l)

– Proteines C-reactives (mg/dl)

A.4 Elements du dossier cardiologique

A.4.1 Donnees cliniques

– Tension arterielle systolique (mm Hg)

– Tension arterielle diastolique (mm Hg)

– Frequence cardiaque au repos (battements/mn)

– Anemie : (O/N)

– Diabete : (Non, I, Insulo-dependant (IDMM), Non-Insulo-dependant (NIDMM))

– Douleurs thoraciques : (Non, Angine de poitrine typique, Angine de poitrine aty-pique, autre)

– Dyspnee(s) : (Non, au repos, a l’effort, au repos et a l’effort)

– Sujet a des Syncope(s) : (O/N)

– Sujet a des Vertiges : (Non, au repos, a l’effort, au repos et a l’effort)

A.4.2 Interpretation de l’ECG au repos

Cette interpretation concerne exclusivement l’interpretation de synthese qui figureradans le dossier clinique du patient. Les interpretations des ECG enregistres par le patientseront archivees dans la rubrique ”Rapport d’interpretation des PEM ECG”

Annexe A. Dossier Medical Personnel embarque dans le PEM 138

– Interpretation de l’ECG standard a 12D : (Normal, probablement normal/non stric-tement normal, Anormal)

– Troubles de la conduction : (O/N)

– Instabilite electrique : (O/N)

– Alteration(s) mineure(s) de l’ECG : (O/N)

A.4.3 Resultats des tests de l’ECG d’effort

– Ischemie a l’effort : (O/N)

– Hypotension durant l’effort : (O/N)

A.4.4 Diagnostic cardiologique

– Hypertension arterielle : (O/N)

– Hypertrophie ventriculaire : (Non, gauche, droite, bi-ventriculaire)

– Tachycardie ventriculaire : (Non, Intermittente/Non-soutenue, Soutenue)

– Bloc auriculo-ventriculaire : (Non, 2eme degre (Mobitz type II), 3eme degre, autre)

– Autre(s) type(s) d’arythmie(s) : (O/N)

Si oui, et si vous estimez que c’est important pour le suivi du patient, precisez letype d’arythmie dans l’historique clinique du patient.

– Stenose aortique : ( Non, I, LAD, LCX, RCA, autre)

– Infarctus ancien : (Non, I, Anterieur ou Antero-Lateral, Inferieur ou Postero-Inferieur, Mixte)

– Ischemie residuelle : (O/N)

– Dysfonctionnement du ventricule gauche : (O/N)

– Insuffisance cardiaque : (Non, moderee, severe)

– Fraction d’ejection (%) :

– Cardiopathies arythmogenes congenitales ou acquises : (Non, QT long, Brugada,WPW, ARVD, autre)

– Cardiopathie valvulaire : (Non, prolapsus de valve mitrale, autre)

– Cardiomyopathie du ventricule gauche : (Non, I, dilatee, hypertrophique, infiltrative,autre)

– Cardiomyopathie du ventricule droit : (O/N)

– Autre type de cardiopathie congenitale : (O/N)

– Maladie des coronaires d’origine anormale : (O/N)

– Autre cardiopathie : (0/N)

Si oui, et si vous estimez que c’est important pour le suivi du patient, precisez letype de cardiopathie dans l’historique clinique du patient.

Annexe A. Dossier Medical Personnel embarque dans le PEM 139

A.4.5 Procedures et traitements

– Therapie interventionnelle : (Non, angioplastie, pontage coronarien, autre)

– Traitement anti-cholesterol : (Non, statines, autres)

– Traitement anti-hypertenseur : (O/N)

– Autre(s) traitement(s) en cours : (O/N)

Si oui, et si vous estimez que c’est important pour le suivi du patient, precisez letype de traitement dans l’historique clinique du patient.

A.5 Facteurs de risque cardiovasculaire

A.5.1 Classe de Sante

Indiquez ci-apres la categorie qui decrit le mieux possible l’etat general de sante dupatient. Ce classement sera utilise pour moduler l’estimation du facteur de risque du sujet.

Categorie de sante : I, 1, 2, 3, 4, 5

Avec :

– 1. Sportif de niveau professionnel

– 2. Sujet normal

– 3. Suspicion d’ischemie et/ou de troubles du rythme

– 4. Ischemie et/ou troubles du rythme averes

– 5. Pathologie cardiaque documentee

A.5.2 Facteurs de risque majeurs

– Sexe : (M, F, I)

– Age :

– Tabagie : (Non fumeur, Ex-Fumeur, Fumeur)

– Obesite : (O/N)

– Diabete : (Non, I, Insulo-dependant (IDMM), Non-Insulo-dependant (NIDMM))

– Hypertension arterielle : (O/N)

– Frequence cardiaque au repos (battements/mn) :

– Cholesterol total (mg/dl) :

– Fibrinogenes (mg/dl) :

Annexe A. Dossier Medical Personnel embarque dans le PEM 140

– Nbre de leucocytes (109/l) :

– Claudication intermittente : (O/N)

A.5.3 Autres facteurs de risque

– Tension arterielle systolique (mm Hg) :

– Tension arterielle diastolique (mm Hg) :

– Anemie : (O/N)

– Maladie des coronaires d’origine anormale : (O/N)

– Antecedents familiaux de maladie des coronaires : (O/N)

– Antecedents familiaux de mort subite : (O/N)

Annexe B

La base de donnees INDANA

La base de donnees INDANA (INdividual Data ANalysis of Antihypertensive druginterventions) reunit les donnees individuelles de 10 essais therapeutiques (controles ran-domises) conduits pour evaluer l’efficacite de traitements anti-hypertenseurs [103].

Les sujets faisant partie de cette base de donnees ont ete suivis, en moyenne, sur uneperiode de 5 ans et toute incidence d’evenements de nature cardiovasculaire a ete releve :accident vasculaire cerebral, infarctus du myocarde, deces par accident vasculaire cerebral,deces par infarctus du myocarde.

Cette base de donnees a ete mise en forme et est maintenue par l’Unite de Pharmaco-logie Clinique de l’Universite Lyon 1 (chef de projet : Francois Gueyffier).

Annexe B. La base de donnees INDANA 142

Tab. B.1 – Tableau descriptif des variables et labels de la base de donnees INDANA

Nom Label Valeur

SEX sexe 0 : femme, 1 : hommeAGE age en annees

BL HEIGH taille en debut d’etude en cmBL WEIGH poids en debut d’etude en kgBL BLO U hematurie en debut d’etudeBL NBCIG nombre de cigarettes en debut d’etude nbre/jour

BL HR frequence cardiaque en debut d’etude batt/mnBL SBP pression arterielle systolique en debut d’etude mmHgBL DBP pression arterielle diastolique en debut d’etude mmHg

BL ECGM1 Q/QS Pattern ( 0 : pas d’anomalie,1 anomalie la

moins significative,2,...x anomalie

la plus significative)BL ECGM3 Hypertrophie ventriculaire gauche /ECG -BL ECGM4 depression du segment ST -BL ECGM5 inversion de l’onde T -

BL AF fibrillation atriale en debut d’etude 0 : non ; 1 : ouiBL GLUC glycemie a jeun en debut d’etude mmol/lBL URIC uricemie en debut d’etude mmol/lBL CHOL cholesterol total en debut d’etude mmol/lBL CREAT creatinemie en debut d’etude mmol/lBL GLY U glycosurie 0 : non 1 :ouiBL PRT U proteinurie 0 : non 1 :oui

BL K kaliemie mmol/lBL SMOKE tabagisme en debut d’etude 0 : non ; 1 :ouiBL CATSM tabagisme en debut d’etude 4 categoriesBL UREA uree sanguine en debut d’etude mmol/lBL BMI index ponderal en debut d’etude kg/m2

HX DIAB antecedent de diabete 0 : non ; 1 : ouiHX TTHBP antecedent de traitement antihypertenseur 0 : non ; 1 : oui

HX HBP antecedent d’hypertension 0 : non ; 1 : ouiHX ANGIN antecedent d’angor 0 : non ; 1 : oui

HX MI antecedent d’infarctus myocardique 0 : non ; 1 : ouiHX ST antecedent d’AVC 0 : non ; 1 : oui

HX CLAUD antecedent de claudication 0 : non ; 1 : ouiST AVC (accident vasculaire cerebral) 0 : non ; 1 : ouiMI IDM (infarctus du myocarde) 0 : non ; 1 : oui

DEATH deces 0 : non ; 1 : ouiDEATHMI deces par IDM 0 : non ; 1 : ouiDEATHST deces par AVC 0 : non ; 1 : ouiDEATHCV deces cardio-vasculaire 0 : non ; 1 : oui

Annexe C

Architecture des reseaux deneurones utilises pour la synthese del’ECG

La meilleure configuration en termes d’architecture des reseaux de neurones utilisespour la synthese de l’ECG standard est determinee experimentalement en effectuant l’ap-prentissage de h×n×t structures obtenues en faisant varier le nombre de couches cachees(h=1, 2), le nombre de neurones par couche (n=3, 5, 8, 10, 15) et le type de fonction d’ac-tivation (t=lineaire (purelin), sigmoıde : tangente sigmoıde (tansig), logarithme-sigmoıde(logsig)). Les resultats detailles des performances des h×n×t structures en termes d’er-reur RMS sur les 100 ECG de la population d’etude DS1 sont presentes dans les tableauxci-apres.

Nb de couches cachees Nb de neurones par couche cache Fonctions d’activation RMS1 3 tansig 107.981 5 tansig 94.721 8 tansig 89.871 10 tansig 89.441 15 tansig 87.471 3 logsig 115.521 5 logsig 104.081 8 logsig 96.951 10 logsig 96.271 15 logsig 91.401 3 purelin 100.141 5 purelin 95.261 8 purelin 90.871 10 purelin 90.821 15 purelin 89.63

Annexe C. Architecture des reseaux de neurones utilises pour la synthese de l’ECG 144

Nb de couches cachees Nb de neurones par couche cache Fonctions d’activation RMS2 3 3 purelin tansig 117.782 3 5 purelin tansig 110.472 3 8 purelin tansig 103.462 3 10 purelin tansig 101.422 3 15 purelin tansig 100.842 5 3 purelin tansig 114.302 5 5 purelin tansig 103.322 5 8 purelin tansig 99.242 5 10 purelin tansig 97.082 5 15 purelin tansig 94.4852 8 3 purelin tansig 113.302 8 5 purelin tansig 104.992 8 8 purelin tansig 96.622 8 10 purelin tansig 96.032 8 15 purelin tansig 91.262 10 3 purelin tansig 113.332 10 5 purelin tansig 102.282 10 8 purelin tansig 97.102 10 10 purelin tansig 95.602 10 15 purelin tansig 92.092 15 3 purelin tansig 112.582 15 5 purelin tansig 101.452 15 8 purelin tansig 97.962 15 10 purelin tansig 95.562 15 15 purelin tansig 90.12

2 3 3 purelin logsig 121.662 3 5 purelin logsig 115.302 3 8 purelin logsig 110.082 3 10 purelin logsig 108.102 3 15 purelin logsig 105.992 5 3 purelin logsig 119.172 5 5 purelin logsig 111.172 5 8 purelin logsig 107.332 5 10 purelin logsig 104.652 5 15 purelin logsig 100.162 8 3 purelin logsig 117.732 8 5 purelin logsig 112.152 8 8 purelin logsig 104.042 8 10 purelin logsig 104.352 8 15 purelin logsig 97.042 10 3 purelin logsig 118.92 10 5 purelin logsig 109.962 10 8 purelin logsig 104.862 10 10 purelin logsig 102.332 10 15 purelin logsig 99.022 15 3 purelin logsig 117.482 15 5 purelin logsig 108.282 15 8 purelin logsig 105.562 15 10 purelin logsig 103.822 15 15 purelin logsig 97.31

Annexe C. Architecture des reseaux de neurones utilises pour la synthese de l’ECG 145

Nb de couches cachees Nb de neurones par couche cache Fonctions d’activation RMS2 3 3 purelin purelin 110.112 3 5 purelin purelin 101.462 3 8 purelin purelin 100.792 3 10 purelin purelin 99.892 3 15 purelin purelin 97.142 5 3 purelin purelin 101.782 5 5 purelin purelin 96.902 5 8 purelin purelin 93.122 5 10 purelin purelin 92.412 5 15 purelin purelin 89.652 8 3 purelin purelin 100.152 8 5 purelin purelin 94.742 8 8 purelin purelin 92.422 8 10 purelin purelin 91.912 8 15 purelin purelin 91.292 10 3 purelin purelin 97.992 10 5 purelin purelin 93.752 10 8 purelin purelin 91.522 10 10 purelin purelin 89.662 10 15 purelin purelin 89.322 15 3 purelin purelin 96.932 15 5 purelin purelin 92.922 15 8 purelin purelin 89.762 15 10 purelin purelin 89.122 15 15 purelin purelin 90.35

2 3 3 tansig purelin 117.412 3 5 tansig purelin 110.352 3 8 tansig purelin 106.522 3 10 tansig purelin 104.342 3 15 tansig purelin 106.192 5 3 tansig purelin 105.432 5 5 tansig purelin 101.042 5 8 tansig purelin 96.762 5 10 tansig purelin 94.112 5 15 tansig purelin 92.292 8 3 tansig purelin 100.342 8 5 tansig purelin 93.2652 8 8 tansig purelin 91.502 8 10 tansig purelin 90.362 8 15 tansig purelin 90.532 10 3 tansig purelin 100.752 10 5 tansig purelin 92.432 10 8 tansig purelin 89.992 10 10 tansig purelin 90.372 10 15 tansig purelin 89.722 15 3 tansig purelin 96.162 15 5 tansig purelin 90.462 15 8 tansig purelin 89.382 15 10 tansig purelin 87.932 15 15 tansig purelin 92.54

Annexe C. Architecture des reseaux de neurones utilises pour la synthese de l’ECG 146

Nb de couches cachees Nb de neurones par couche cache Fonctions d’activation RMS2 3 3 tansig tansig 122.052 3 5 tansig tansig 115.652 3 8 tansig tansig 110.842 3 10 tansig tansig 108.032 3 15 tansig tansig 108.322 5 3 tansig tansig 117.672 5 5 tansig tansig 111.402 5 8 tansig tansig 104.122 5 10 tansig tansig 100.062 5 15 tansig tansig 96.972 8 3 tansig tansig 116.082 8 5 tansig tansig 105.172 8 8 tansig tansig 100.782 8 10 tansig tansig 99.052 8 15 tansig tansig 92.582 10 3 tansig tansig 114.792 10 5 tansig tansig 104.512 10 8 tansig tansig 99.752 10 10 tansig tansig 95.492 10 15 tansig tansig 92.542 15 3 tansig tansig 115.552 15 5 tansig tansig 105.042 15 8 tansig tansig 97.742 15 10 tansig tansig 94.802 15 15 tansig tansig 91.58

2 3 3 tansig logsig 126.312 3 5 tansig logsig 121.162 3 8 tansig logsig 115.392 3 10 tansig logsig 112.542 3 15 tansig logsig 113.792 5 3 tansig logsig 120.732 5 5 tansig logsig 117.932 5 8 tansig logsig 110.832 5 10 tansig logsig 106.812 5 15 tansig logsig 104.962 8 3 tansig logsig 121.372 8 5 tansig logsig 111.082 8 8 tansig logsig 107.472 8 10 tansig logsig 106.552 8 15 tansig logsig 100.682 10 3 tansig logsig 118.472 10 5 tansig logsig 111.332 10 8 tansig logsig 106.692 10 10 tansig logsig 104.072 10 15 tansig logsig 99.012 15 3 tansig logsig 119.302 15 5 tansig logsig 111.372 15 8 tansig logsig 105.102 15 10 tansig logsig 102.212 15 15 tansig logsig 98.76

Annexe C. Architecture des reseaux de neurones utilises pour la synthese de l’ECG 147

Nb de couches cachees Nb de neurones par couche cache Fonctions d’activation RMS2 3 3 logsig purelin 126.652 3 5 logsig purelin 120.572 3 8 logsig purelin 115.922 3 10 logsig purelin 114.462 3 15 logsig purelin 113.482 5 3 logsig purelin 116.132 5 5 logsig purelin 111.222 5 8 logsig purelin 105.662 5 10 logsig purelin 102.112 5 15 logsig purelin 99.472 8 3 logsig purelin 109.412 8 5 logsig purelin 102.862 8 8 logsig purelin 98.092 8 10 logsig purelin 94.472 8 15 logsig purelin 93.912 10 3 logsig purelin 110.202 10 5 logsig purelin 102.042 10 8 logsig purelin 95.612 10 10 logsig purelin 95.742 10 15 logsig purelin 92.072 15 3 logsig purelin 101.852 15 5 logsig purelin 97.262 15 8 logsig purelin 92.902 15 10 logsig purelin 91.432 15 15 logsig purelin 91.55

2 3 3 logsig tansig 122.772 3 5 logsig tansig 114.972 3 8 logsig tansig 108.592 3 10 logsig tansig 105.432 3 15 logsig tansig 104.802 5 3 logsig tansig 119.262 5 5 logsig tansig 111.482 5 8 logsig tansig 103.362 5 10 logsig tansig 100.102 5 15 logsig tansig 95.902 8 3 logsig tansig 118.562 8 5 logsig tansig 105.082 8 8 logsig tansig 101.522 8 10 logsig tansig 99.862 8 15 logsig tansig 93.032 10 3 logsig tansig 115.712 10 5 logsig tansig 105.832 10 8 logsig tansig 100.652 10 10 logsig tansig 96.692 10 15 logsig tansig 92.682 15 3 logsig tansig 118.882 15 5 logsig tansig 107.362 15 8 logsig tansig 99.582 15 10 logsig tansig 96.402 15 15 logsig tansig 93.07

Annexe C. Architecture des reseaux de neurones utilises pour la synthese de l’ECG 148

Nb de couches cachees Nb de neurones par couche cache Fonctions d’activation RMS2 3 3 logsig logsig 126.312 3 5 logsig logsig 120.692 3 8 logsig logsig 113.882 3 10 logsig logsig 110.742 3 15 logsig logsig 111.162 5 3 logsig logsig 122.062 5 5 logsig logsig 118.142 5 8 logsig logsig 110.362 5 10 logsig logsig 106.142 5 15 logsig logsig 103.402 8 3 logsig logsig 122.822 8 5 logsig logsig 111.392 8 8 logsig logsig 107.132 8 10 logsig logsig 105.852 8 15 logsig logsig 99.452 10 3 logsig logsig 118.972 10 5 logsig logsig 112.702 10 8 logsig logsig 106.202 10 10 logsig logsig 104.472 10 15 logsig logsig 98.622 15 3 logsig logsig 121.732 15 5 logsig logsig 112.472 15 8 logsig logsig 106.112 15 10 logsig logsig 102.592 15 15 logsig logsig 98.71

Annexe D

SCPECG Processor

Description

Pour faciliter le traitement des ECGs enregistres au format SCP-ECG par les outilsd’aide a la decision developpes dans le cadre d’EPI-MEDICS, nous avons developpe unlogiciel autonome (stand-alone) intitule ”SCP-ECG processor” (Figure D.1). Ce logicielpermet d’analyser les ECGs par le biais d’une serie de modules qui ont ete developpes.Il est egalement dote d’un module d’aide a la decision a base de comites de reseaux deneurones similaire a celui developpe dans le chapitre 2 de ce rapport de these et d’unmodule de synthese de l’ECG par regression generique et specifique. De meme ce logicielest concu pour integrer tout autre module d’analyse, d’interpretation, ou d’aide a ladecision (les modules de reseaux bayesiens, de logique floue, etc.).

Principaux modules integres

– BuildFake10sEcg Ce module simule un enregistrement d’ECG de 10 secondesa partir du complexe median et du rythme cardiaque. Ce module est utile pouranalyser les fichiers SCP-ECP ne contenant que le complexe median.

– PermuteFR Ce module a pour mission de corriger (ou simuler) une inversion deselectrodes F et R.

– PermuteLF Ce module a pour mission de corriger (ou simuler) une inversion deselectrodes L et F.

– PermuteLR Ce module a pour mission de corriger (ou simuler) une inversion deselectrodes L et R.

– 12-Lead Synthesis Ce module permet a l’utilisateur de choisir la methode desynthese a employer :

– No synthesis : aucune synthese n’est effectuee.

Annexe D. SCPECG Processor 150

– Generic 12-Lead Synthesis : La matrice de synthese generique est utilisee. Cettematrice est actuellement basee sur un modele de regression generique.

– Patient Specific Regression : une matrice de synthese specifique au patient estcalculee suivant un modele de regression sur l’ECG concerne.

– User Specific ANN Synthesis : une matrice de synthese specifique au patientest fournie.

– Compute Typical Beat and global measurements Ce module applique leprogramme de Lyon pour calculer les mesures globales de l’ECG concerne.

– Compute Lead by Lead Measurements Ce module applique le programme deLyon pour calculer les mesures, derivation par derivation, de l’ECG concerne.

– Output File to Write Suivant la selection effectuee par l’utilisateur, le logicielgenere differents fichiers en sortie : un nouveau fichier SCP-ECG de l’ECG, lesmesures globales, les mesures derivation par derivation, les donnees apres analyseen composantes principales de l’ECG et le resultat de l’interpretation de l’ECG parcomites de reseaux de neurones.

Annexe D. SCPECG Processor 151

Fig. D.1 – Ecran de configuration du logiciel SCP-ECG processor.

Annexe E

EPI-MEDICS : modeles de donneesglobaux du PEM

Annexe E. EPI-MEDICS : modeles de donnees globaux du PEM 153

Annexe E. EPI-MEDICS : modeles de donnees globaux du PEM 154

Annexe F

Publications

Revues internationales avec comite de lecture

– H. Atoui, D. Sarrut, S. Miguet. A Fast Morphing-Based Interpolation For Medi-cal Images : Application To Conformal Radiotherapy. Image Anal Stereol, 2006 ;25(2) :95-103.

– H. Atoui, J. Fayn, P. Rubel. A Novel Neural Network Model for Deriving Standard12-lead ECGs from serial 3-lead ECGs. Application to Self Care. Submitted toMethods Inf Med.

– P. Rubel, J. Fayn, G. Nollo, D. Assanelli, B. Li, L. Restier, S. Adami, S. Arod, H.Atoui, et al. Toward personal eHealth in cardiology. Results from the EPI-MEDICStelemedicine project. J Electrocardiol, 2005 ;38 :100-106.

Revues nationales avec comite de lecture

– P. Rubel, J. Fayn, H. Atoui, et al. Intelligence Ambiante et Systemes Pervasifsen Telemedecine. Exemple d’Application en Telecardiologie. La Revue des SAMU,2004 ;26 :521-26.

Chapitre dans un livre

– P. Rubel, J. Fayn, L Simon-Chautemps, H. Atoui, et al. New paradigms in Tele-medicine : Ambient Intelligence, Wearable, Pervasive and Personalized. Stud HealthTechnol Inform. 2004 ; 108 :123-32.

Annexe F. Publications 156

Conferences internationales avec comite de lecture

– H. Atoui, J. Fayn, F. Gueyffier, and P. Rubel. Cardiovascular Risk Stratificationin Decision Support Systems, A Probabilistic Approach. Application to pHealth.Accepted for publication in Computers in Cardiology 2006.

– H. Atoui, J. Fayn and P. Rubel. A Neural Network Approach for Patient-specific12-lead ECG Synthesis in Patient Monitoring Environments. In : Murray A., Ed.,Computers in Cardiology, Los Alamitos (USA) : IEEE Computer Society, 2004 ;31 :161-64.

– H. Atoui, D. Sarrut, S. Miguet. Usefulness of Image Morphing Techniques in Can-cer Treatment by Conformal Radiotherapy. In : Robert L. Galloway, Ed., MedicalImaging : Visualization, Image-Guided Procedures, and Display, 2004 ; 5367 :332-40.

– J. Fayn, C. Ghedira, D. Telisson, H. Atoui, P. Rubel, et al. Towards New Inte-grated Information and Communication Infrastructures in eHealth. Examples fromCardiology. In : Murray A., Ed., Computers in Cardiology, Los Alamitos (USA) :IEEE Computer Society, 2003 ; 30 :113-16.

Conferences internationales invitees

– P. Rubel, J. Fayn, H. Atoui, D. Telisson, P. Chevalier. From eHealth to PervasiveSolutions and Ambient Intelligence in pHealth. An International Perspective withExamples from Cardiology. International Initiative for Ubiquitous Healthcare (u-Health), Med-e-Tel, Luxembourg, April 5-7, 2006.

– H. Atoui, J. Fayn, P. Rubel. Advanced methods of data fusion of ECG and clinicaldata for self-care diagnosis enhancement. 6th STAFF Studies Symposium. Septem-ber 28 - October 1, 2005.

– P. Rubel, J. Fayn, H. Atoui, et al. Pre-hospital acute decision support. 6th STAFFStudies Symposium. September 28 - October 1, 2005.

– J. Fayn, H. Atoui, P. Rubel, et al. Embedded decision making in eCardiology.Lessons learned from the EPI-MEDICS project. International Workshop on Perso-nalised Health, Belfast, December 13-15, 2004.

– P. Rubel, J. Fayn, H. Atoui, D. Telisson. Beyond EPI-MEDICS. In Proceedings ofthe 2nd OpenECG Workshop. Integration of the ECG into the EHR & Interopera-bility of the ECG Device Systelms. Berlin, Germany, April 1-3, 2004 :75-6.

– P. Rubel, J. Fayn, L. Simon-Chautemps, H. Atoui, et al. New paradigms in Te-lemedicine : Ambient Intelligence, Wearable, Pervasive and Personalized. eHealthWorkshop : New generation of wearable systems for health : Towards a revolutionof citizens’ health and life style management ? Lucca, Italy, December 12-14, 2003.

Annexe F. Publications 157

Conferences nationales avec comite de lecture

– H. Atoui, D. Telisson, et al. Detection precoce d’evenements cardiaques en self-care. Architecture fonctionnelle de la plateforme d’aide a la decision par reseauxde neurones du projet europeen EPIMEDICS. Journees Sciences, Technologies etImagerie pour la Medecine, Nancy, 2005 : 13-14.

Conferences ou journees thematiques nationales

– H. Atoui. Conception de systemes intelligents pour la telemedecine citoyenne. Ren-contres Regionales de la Recherche, Lyon, 2004 (poster).

Seminaires

– Techniques d’imagerie pour l’aide au positionnement du patient en radiotherapieconformationnelle. Octobre 2002. Laboratoire ERIC

Conception de Systemes Intelligents pour la TelemedecineCitoyenne

Hussein ATOUI

Resume Ces recherches s’inscrivent dans la continuite du projet europeen EPI-MEDICS (Enhanced Personal Intelligent & Mobile system for Early Detection & Inter-pretation of Cardiovascular Syndromes) du programme Information Society Technologies,qui a pour objectif la realisation d’un moniteur personnel d’ECG (PEM) intelligent, doted’un serveur embarque et d’un composant metier d’analyse quantitative de l’ECG, com-pact, portable et utilisable par tous, y compris par le patient lui-meme, un aidant, oun’importe quel citoyen. Le PEM est capable d’enregistrer un ECG 3D simplifie conte-nant la quasi-totalite des informations spatio-temporelles produite par l’activite du cœuret capable d’envoyer par GPRS ou UMTS differents types de messages ou d’alarmesconvoyant des ECG et un mini-dossier medical de l’utilisateur. C’est dans ce contexte quenous avons cherche a ameliorer l’intelligence du systeme en developpant une plateformeauto-adaptative et auto-evolutive de detection automatique des dysfonctionnements ducoeur. Cette plateforme permet de stratifier le risque de la survenue d’un evenement car-diovasculaire moyennant l’interpretation de l’ECG combinee avec l’historique medical del’utilisateur.L’aide au diagnostic consiste a mettre en oeuvre des algorithmes resolvant un probleme declassement compte tenu de l’incertitude sur la situation reelle de l’objet etudie. Les travauxpresentes dans ce memoire etudient differents aspects de cette tache. Tout d’abord, nousproposons une modelisation du processus de diagnostic de l’infarctus a partir de l’ECG.L’interpretation automatique de l’ECG est effectuee a l’aide de comites de reseaux deneurones artificiels. Une serie d’experimentations illustre la superiorite des reseaux deneurones par rapport aux resultats obtenus par des cardiologues interpretant le meme en-semble de donnees. Ensuite, afin d’obtenir un diagnostic plus precis et plus personnalise,nous proposons d’inclure une stratification des informations cliniques de l’utilisateur tellesque les facteurs de risque. Notre approche consiste a utiliser les reseaux bayesiens pouretablir une quantification probabiliste du risque cardiovasculaire. Nous proposons enfinun algorithme permettant de fusionner le score de l’interpretation de l’ECG realisee parles reseaux de neurones avec celui obtenu par les reseaux bayesiens a partir des facteursde risque. Cette fusion constitue l’un des fondements de la future plateforme d’aide a ladecision qui sera embarquee dans le PEM, systeme qui sera a la fois auto-adaptatif enfonction de la specificite de chaque utilisateur et auto-evolutive grace au potentiel d’ap-prentissage automatique des reseaux de neurones et des reseaux bayesiens.Dans la deuxieme partie de cette these, nous etudions un formalisme permettant de rendrel’ECG simplifie du PEM accessible, sous un format comprehensible et interpretable, auxprofessionnels de sante. Il s’agit de synthetiser un ECG standard 12D a partir de l’ECG3D du PEM. Cette synthese doit permettre non seulement une detection precise, maisegalement une reproduction la plus fidele possible des caracteristiques de l’ECG standardsi ce dernier avait ete enregistre simultanement avec l’ECG 3D du PEM. C’est la raisonpour laquelle nous nous sommes orientes vers des techniques d’intelligence artificielle met-tant en œuvre une methode originale de reconstruction des ECG basee sur l’utilisationde comites de reseaux de neurones. Une serie de tests sur des bases de donnees d’ECGstandards et d’ECG PEM enregistres dans des conditions simulant celles d’utilisation duPEM, a montre que notre approche a largement depasse les methodes conventionnelles.Enfin, nous avons travaille sur la conception de strategies de deploiement pour la mise enœuvre de methodes de synthese de l’ECG specifique a chaque patient au moyen d’infra-structures ad hoc permettant de realiser l’apprentissage neuronal a grande echelle, graceaux technologies des services web et des grilles de calcul.Mots cles Systemes pervasifs - Intelligence ambiante - Intelligence artificielle - Fusionde donnees - Aide a la decision - Telemedecine citoyenne