C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

15
C.I. B. Lill Couplage BASE/Outils de Data Mining Pierre LAURENCE

Transcript of C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

Page 1: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

C.I.B.

Lille

Couplage BASE/Outils de Data Mining

Pierre LAURENCE

Page 2: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

2C.I.B. Lille

Plan

• Introduction• MIAME• Base de données• BASE• Intégration d’outils de Data mining• Conclusions

Page 3: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

3C.I.B. Lille

Introduction

• Le volume des données pour l’étude du transcriptome est de plus en plus important :Pour une expérience ‘classique’ d’une puce

à 7500 points, plus de 300 000 valeurs associées aux données brutes

Volonté d’intégrer aux analyses des informations supplémentaires

Besoin de stocker d’une façon organisée les informations qui circulent dans un laboratoire de puces à ADN

Page 4: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

4C.I.B. Lille

MIAME (1/2)

• Minimal Information About a Microarray Experiment

• Spécifier la nature de l’information qui doit être fournie pour l’étude sur micro-puce pour faciliter La vérification La comparaison L’interprétation La reproduction

• Motivation La création d’espaces publiques d’échanges de

résultats de micro-puces

Page 5: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

5C.I.B. Lille

MIAME (2/2)

• 4 groupes d’informations : Le design de la lame : disposition des spots,

contrôles qualités, protocoles de spotting …

Le matériel biologique : les échantillons utilisés, la préparation de l’extraction, le marquage et l’hybridation.

Les mesures et quantifications : données brutes sorties des logiciels d’analyse d’images (Imagene, Genepix…)

L’expérience : objectif(s) et méthodes d’analyses (normalisations, tests statistiques, …)

Page 6: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

6C.I.B. Lille

BASE (BioArray Software Environment) (1/7)

BASE DE DONNEES

SERVEUR WEB distant ou local

CLIENTS : Laboratoires de transcriptomique

Université de Lund (Suède)

Page 7: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

7C.I.B. Lille

BASE (2/7)

Expérience : Experiment / Analyse Data

Mesures et quantifications

Design de lame :Array LIMS

( Laboratory Information Management System )

Matériel biologique : Biomaterial

Page 8: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

8C.I.B. Lille

BASE : accueil (3/7)

Page 9: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

9C.I.B. Lille

BASE : reporters (4/7)

Page 10: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

10C.I.B. Lille

BASE : raw data sets (5/7)

Page 11: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

11C.I.B. Lille

BASE : analysis steps (6/7)

Page 12: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

12C.I.B. Lille

BASE : plugins (7/7)

Page 13: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

13C.I.B. Lille

Intégration d’outils de DM (1/2)

• Système de plugins intégré• Existence d’API (C++, JAVA, R)• Gestionnaire de jobs évolué

DM

GRID

BASE

Données

export data

API

Plugin

Page 14: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

14C.I.B. Lille

Intégration d’outils de DM (2/2)

• En cours de développement, plugin « Régles d’Associations » (à partir du travail de M. Khabzaoui)

• Tests «biologiques» grâce aux plateformes transcriptomiques de la Génopole de Lille

• Par la suite, mise à disposition pour la communauté BASE

Page 15: C.I.B. Lille Couplage BASE/Outils de Data Mining Pierre LAURENCE.

15C.I.B. Lille

Conclusions

• Avantages pour le développement InterfaceGestion de plugins Jobs managerAPI

• Avantages pour les biologistesAucun changement d’habitudeLes données restent confidentiellesDes nouveaux outils innovantsUne éventuelle grille serait transparente