Julie Chabalier Post-doctorante Laboratoire d’Informatique Médicale Université Rennes 1
-
Upload
basil-brennan -
Category
Documents
-
view
37 -
download
1
description
Transcript of Julie Chabalier Post-doctorante Laboratoire d’Informatique Médicale Université Rennes 1
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Rennes
Marseille
Parcours
Maîtrise de Biologie Cellulaire (1999)
DESS Compétences Complémentaires en Informatique (2000)
Doctorat en Informatique (2004) Soutenu le 6 avril 2004 – mention très honorable « Acquisition incrémentale et représentation des systèmes
intégrés bactériens par une approche orientée objet »
1/2 ATER (2004 - 2005)
Qualifications sections 64, 65, 27 (2005)
Post-doctorante Université de Rennes 1 (2005 – 2008)
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Enseignements (278h eq. TD)
Initiation à la bioinformatique (licence) Grandes banques/bases de données Concepts majeurs de la bioinformatique
Représentation des connaissances biomédicales (master2) Ontologies biologiques et médicales Web Sémantique
Conception, implémentation, interrogation de bases de données (master)
Modélisation MERISE- UML Langage SQL – MySQL
Initiation à l’informatique (licence) Bureautique - Algorithmique
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
BesoinsStructuration et description, non ambigüe, des connaissances disponibles dans un domaine
Partage des connaissances
Exploitation automatique de ces connaissances pour interpréter les données
Thématique de recherche
Contexte Projets de séquençage / nouvelles technologies à haut debit (transcriptome) Explosion de la quantité de données biologiques Interprétation des données : apporter du sens à ces données (les annoter)
une tâche très difficile Terminologies différentes en fonction du domaine
même mot : significations différentes d'un domaine à un autre Rôle croissant des bases de données en biologie
Difficile d’avoir une vision globale des informations disponibles
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Les ontologies Définition des concepts d’un domaine et des relations entre ces concepts (conceptualisation)
Représentation dans un langage informatique rendant les connaissances compréhensibles par un ordinateur (formalisation)
Exemples
Génomique : Gene Ontology Annotation des produits de gènes
Médecine : SNOMED CT Description des maladies
Thématique de recherche
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
molecularfonction
binding
transcriptionregulator activity
transcription factor activity
DNA binding
nucleic acid binding
cellular component
organelle
Intracellular organelle
nucleus
intracellular membrane- bound organelle
membrane- bound organelle
intracellular
cell
part_of
is_a
biological process
developmental process
multicellular organismal development
nervous system development
system development
anatomical structure development
Transcription factor AP-2 beta (AP2B)
Produit de gène Annotation des produits de gènes
Gene Ontology
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Utilisation de Gene Ontology pour interpréter les résultats de puces à ADN
Puparial adhesionMolting cyclehemocyanin
Defense responseImmune responseResponse to stimulus
Toll regulated genesJAK-STAT regulated genes
Immune responseToll regulated genes
Amino acid catabolismLipid metobolism
Peptidase activityProtein catabloismImmune response
Selected Gene Tree: pearson lw n3d ...Branch color classification:Set_LW_n3d_5p_...
Colored by: Copy of Copy of C5_RMA (Defa...Gene List: all genes (14010)
infectée controle
temps
Selected Gene Tree: pearson lw n3d ...Branch color classification:Set_LW_n3d_5p_...
Colored by: Copy of Copy of C5_RMA (Defa...Gene List: all genes (14010)
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
organic mental disorder
Alzheimer's disease
dementia
disorder of brain
SNOMED CT Systematized Nomenclature of Medicine -- Clinical Terms
Echanger des informations cliniques entre les différents professionnels de la santé (médecin, pharmacien, chercheur…)
cerebral degeneration
Degenerative brain disorder
Description des maladies suivant des critères cliniques (étiologie, localisation, morphologie…)
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Trois axes complémentaires :
1. Représentation des connaissances biologiques
2. Interprétation des données d’expression
3. Intégration des connaissances biologiques et médicales
Travaux de recherche
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Projet « ISYMOD » (thèse octobre 2000 – avril 2004)
Représentation des systèmes intégrés biologiques
1. Représentation des connaissances biologiques
Un système intégré est un ensemble de protéines nécessaires à la réalisation d’une fonction biologique
SystemeIntegretypenbPartenaires
est_composé
TransporteurABC
OPUBA
Proteine
• Entités biologiques : classes/sous-classes
• Relations entre entités : associations/sous-associations
• Propriétés : variables de classes/d’associations
Systeme2composants
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
36 Classes – 21 associations100 génomes procaryotes 13641 partenaires protéiques5328 transporteurs ABCChabalier et al., 2005
Bioinformatics
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Projet « Analyse transversale » (postdoc 2004 – 2006)
Interprétation des données d’expression par l’exploitation des concepts de Gene Ontology
2. Interprétation des données d’expression
Analyse classique : associer un ou plusieurs termes à un cluster d’expression
Analyse transversale : regrouper les gènes en fonction de leur annotation et associer l’expression à chaque gène au sein des groupes
Limitation : au sein d’un même processus biologique, les gènes peuvent s’exprimer différentiellement (ex : régulation)
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
gène 1gène 2gène 3gène 4gène 5gène 6gène 7gène 8…
gène n
biological process
process D
process E
process C
process B
process G
process F
gène 1 gène 5
Comparaison des annotations (modèle espace vectoriel)
gène 1 (process B, process E, …)gène 5 (process E, process F, …)
gène 1 gène 20<sim<1
gène 1 gène 20<sim<1
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Activation d’une voie de biosynthèse du précurseur de la créatine
Répression de la biosynthèse de polyamine
Rôle potentiel de détoxification de l’entérocyte
Chabalier et al., 2007 BMC Bioinformatic
Application de l’analyse transversale
Analyse des gènes impliqués dans la differentiation enterocytaire
Métabolisme des amines
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Projet « Biomed » (postdoc 2006 – 2008)
3. Intégration des connaissances biomédicales
Description des maladies dans les ontologies médicales Caractéristiques cliniques (Etiologie, Localisation,
Morphologie…)
Exemple : SNOMED CT Besoin des connaissances biologiques
Gènes La mutation d’un gène peut conduire à une maladie
Voies métaboliques / Processus biologiques différents processus pourraient expliquer les différents grades d’une maladie
Intégrer des ontologies de maladies et de processus biologiques
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Ontologie des maladies
Gene OntologyProcessusbiologiques
Kegg OrthologyVoies métaboliques
Maladies
SNOMED CT Maladies
Méthodologie générale d’intégration
Chabalier et al., 2007 Stud Health Technol Inform.
Méthode de mise en correspondance des termes
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Cancers
Aspect invasif
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Projet enseignements
DUT Génie Biologique Informatique (cours – TD – TP)
Bureautique (Office/Open office : word, excel, access) Programmation (Perl, PHP, Java…) Bases de données (Oracle-SQL, mySQL)
Biologie (cours – TD)
Licence Pro Biologie Analytique et Expérimentale Bioinformatique (cours – TD – TP)
Base de données biologiques Méthodes bioinformatiques d’analyse des données Nouvelles technologies dans le domaine biomédical
Ontologies biomédicales
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Projet recherche – UMR 1231
Comparaison fonctionnelle des génomes des insectes
Contexte Étude comparative des génomes des lépidoptères
Spodoptera – Helicoverpa - Bombyx mori Impact du centromère sur l’expression des gènes proches
Méthodologie Etude du génome et génomique comparative (synténie) Etude du transcriptome
Besoin Interprétation des données
Structuration et description des connaissances disponibles chez les insectes (processus biologiques) Exploitation automatique de ces connaissances pour interpréter les données
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Méthode
Utilisation de Gene Ontology - Drosophile (Adams et al. Science. 2000 Mar 24;287(5461):2185-95)
Enrichissement de cette ontologie pour l’ensemble des insectes
Extraction et intégration des connaissances de différentes sources trans-espèces :
KEGG (voies métaboliques : drosophile, bombyx, moustique…) Reactome (processus biologiques et réactions : drosophile) Base de données spécialisées
Exploitation de l’ontologie des insectes
Analyse données d’expression : analyse transversale Comparaison trans-espèces
Intégration future de données écologiques ou comportementales
Représentation des processus biologiques chez les insectes
Etude comparée des différentes espèces
Approche proposée
Audition Maître de Conférences - Université Montpellier II - Lundi 26 mai 2008
Résultats attendus
Description non ambigüe du domaine
Réponses aux questions :
Quels sont les processus biologiques communs à toutes les espèces d’insectes ?
Quels sont les processus biologiques spécifiques à une espèce ?
(ex : puceron parthénogénèse)
Quels sont les réactions spécifiques aux génomes holocentriques ?
Annotation des nouveaux génomes, relations entre les gènes d’insectes sans fonction connue mais présentant des domaines fonctionnels
Prédiction de nouveaux processus biologiques par comparaison trans-espèce (relation avec la biologie de catégories d’insectes : vecteurs de virus, ravageurs, hématophages)