C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.
-
Upload
berenice-lepretre -
Category
Documents
-
view
109 -
download
0
Transcript of C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.
C.I.B.
Lille
Couplage BASE/Outils de Data Mining
Pierre LAURENCE
2C.I.B. Lille
Plan
• Introduction• MIAME• Base de données• BASE• Intégration d’outils de Data mining• Conclusions
3C.I.B. Lille
Introduction
• Le volume des données pour l’étude du transcriptome est de plus en plus important :Pour une expérience ‘classique’ d’une puce
à 7500 points, plus de 300 000 valeurs associées aux données brutes
Volonté d’intégrer aux analyses des informations supplémentaires
Besoin de stocker d’une façon organisée les informations qui circulent dans un laboratoire de puces à ADN
4C.I.B. Lille
MIAME (1/2)
• Minimal Information About a Microarray Experiment
• Spécifier la nature de l’information qui doit être fournie pour l’étude sur micro-puce pour faciliter La vérification La comparaison L’interprétation La reproduction
• Motivation La création d’espaces publiques d’échanges de
résultats de micro-puces
5C.I.B. Lille
MIAME (2/2)
• 4 groupes d’informations : Le design de la lame : disposition des spots,
contrôles qualités, protocoles de spotting …
Le matériel biologique : les échantillons utilisés, la préparation de l’extraction, le marquage et l’hybridation.
Les mesures et quantifications : données brutes sorties des logiciels d’analyse d’images (Imagene, Genepix…)
L’expérience : objectif(s) et méthodes d’analyses (normalisations, tests statistiques, …)
6C.I.B. Lille
BASE (BioArray Software Environment) (1/7)
BASE DE DONNEES
SERVEUR WEB distant ou local
CLIENTS : Laboratoires de transcriptomique
Université de Lund (Suède)
7C.I.B. Lille
BASE (2/7)
Expérience : Experiment / Analyse Data
Mesures et quantifications
Design de lame :Array LIMS
( Laboratory Information Management System )
Matériel biologique : Biomaterial
8C.I.B. Lille
BASE : accueil (3/7)
9C.I.B. Lille
BASE : reporters (4/7)
10C.I.B. Lille
BASE : raw data sets (5/7)
11C.I.B. Lille
BASE : analysis steps (6/7)
12C.I.B. Lille
BASE : plugins (7/7)
13C.I.B. Lille
Intégration d’outils de DM (1/2)
• Système de plugins intégré• Existence d’API (C++, JAVA, R)• Gestionnaire de jobs évolué
DM
GRID
BASE
Données
export data
API
Plugin
14C.I.B. Lille
Intégration d’outils de DM (2/2)
• En cours de développement, plugin « Régles d’Associations » (à partir du travail de M. Khabzaoui)
• Tests «biologiques» grâce aux plateformes transcriptomiques de la Génopole de Lille
• Par la suite, mise à disposition pour la communauté BASE
15C.I.B. Lille
Conclusions
• Avantages pour le développement InterfaceGestion de plugins Jobs managerAPI
• Avantages pour les biologistesAucun changement d’habitudeLes données restent confidentiellesDes nouveaux outils innovantsUne éventuelle grille serait transparente