IODAA - Agro ParisTech · , c'est- à-dire qui ne soit pas la simple application de recettes...

23
/ 21 IODAA de l’1nf0rmation à la Décision par l’ Analyse et l’ Apprentissage

Transcript of IODAA - Agro ParisTech · , c'est- à-dire qui ne soit pas la simple application de recettes...

/ 21

IODAAde l’1nf0rmation à la Décision

par l’Analyse et l’Apprentissage

/ 212IODAA – Informations générales

/ 21

Un monde nouveau

/ 21

• Des données numériques partout en croissance prodigieuse

– Comment en extraire des connaissances

– Comment réaliser des systèmes pour aider à la décision

4IODAA – Informations générales

/ 21

Demain

• Nous vivrons dans un monde numérique entourés de systèmes qui traiteront l’information pour nous (et avec nous)

– Analysant cette information

– Extrayant des connaissances

– Échangeant des connaissances

– Inférant collectivement des connaissances

• Nous passerons d’un monde (numérique) fermé et précis … à un monde ouvert et imprécis et parfois incohérent

5IODAA – Informations générales

[ Conf. Invitée de Serge Abiteboul à CAP-2013 ]

/ 21

4 approches pour appréhender le monde

1. Empirique : description et classement

3. Simulation : systèmes complexes et/ou non reproductibles

ParisTech Review (19/12/2011) : « Prospects and Promise of Big Data »

4. Exploration de données• Énormes masses de données numérisées

• Largement disponibles

• Sources et formats très différents

2. Théorique : Modélisation, construction de théories

Présentateur
Commentaires de présentation
• Evolution de la manière d'appréhender le monde et d'essayer de le comprendre. 4 approches qui se complètent. Les deux dernières, issues de la révolution informatique, sont d'importance croissante dans l'activité scientifique comme dans celle des décideurs en entreprise ou dans directions gouvernementales ou non gouvernementales. • Il y a donc un besoin croissant d'ingénieurs formés à ces outils et techniques, ce qui ne s'improvise pas. • C'est un enjeu général, mais spécialement dans les sciences du vivant et de l'environnement qui concerne des systèmes complexes naturels, donc non modélisés a priori, multi-échelles de temps et d'espace avec de nombreuses boucles de rétro-action. Nos élèves ingénieurs qui sont formés à analyser et modéliser ces systèmes complexes sont bien préparés à compléter leurs compétences par la connaissance de ces nouvelles approches. • La DA IODAA vise donc à compléter la formation des élèves ingénieurs en leur donnant les bases sur les outils et méthodes de fouille de données, d'aide à la décision dans une moindre mesure et de travail collaboratif et multi-disciplinaire.

/ 21

Questions

• Comment extraire des connaissances de toutes les informations disponibles ?

• Comment décider ce qui est vrai / faux ?

• Comment décider ce qui est intéressant ?

• Comment gérer des flux massifs de données spatio-temporelles ?

• Comment garder le contrôle sur nos propres données et protéger notre vie

privée ?

• Comment faire collaborer des milliards de systèmes de connaissances ?

7IODAA – Informations générales

[ Conf. Invitée de Serge Abiteboul à CAP-2013 ]

/ 21

… et vous

/ 21

Vous …

• … avez été formés

– Acquisition de nombreuses connaissances (sciences du vivant et de l’environnement)

– Méthodes de modélisation (outils mathématiques)

• Connaissances de base en programmation et bases de données

– Limitées

– Mais nous ne cherchons pas à faire de vous des programmeurs ou informaticiens

• Vous rendre compétent

– dans les méthodes et techniques d’extraction d’information dans l’univers numérique

– capacité à dialoguer avec les informaticiens et à diriger un projet utilisant la fouille de données dans l’univers numérique

/ 21

Fouille de données et aide à la décision

Articles scientifiques

Documents (html, …)

Bases de Données

Données de capteurs(smartphones, senseurs, ..)

Mesures sur les réseaux

• Question en vue d’une décision

• Analyse exploratoire : quelles régularités ?

• Hypothèse : confirmation / infirmation

PrétraitementsFormatagesFusion

Fouille de donnéesApprentissage ArtificielAnalyses statistiques

AnalyseConstruction de modèles

ClassificationPrédictionDescriptionThéorie

Expert(s)

Données nettoyées et formatées

MotifsRégularités

Présentateur
Commentaires de présentation
• Un peu plus concrètement, en quoi consiste l'activité de fouille de données. On peut le schématiser par un cycle. Aspect de boucle, de suivi dans le temps. Importance de savoir travailler en équipe avec des spécialistes d'autres domaines : informaticiens, experts du domaine cible, etc.

/ 21

I O D A A

/ 21

Organisation de la formation

• 4 blocs dont 3 projets « fil rouge » + 1 stage

Le travail collaboratif et interdisciplinaire

100 h

Modélisation pour l’aide à la décision

100 hFouille de données avancée

140 h

Socle en informatique 145 h

Présentateur
Commentaires de présentation
1- Le "data crunching" et les aspects de travail collaboratif et interdisciplinaire. (C'est à la fois la voute de l'édifice et sa perspective. L'objectif est que l'étudiant est une bonne connaissance du contexte d'un projet de fouille de données, qu'il ne soit pas intimidé face aux différentes sources de données, et qu'il sache participer puis organiser des équipes de travail collaboratif et interdisciplinaire.) 2- Un socle sur les méthodes et outils de l'informatique à la base des nouvelles approches (donc de l'algorithmique et de la programmation, permettant en particulier le dialogue avec les informaticiens qui sont souvent partie prenante de tels projets). 3- Les méthodes et techniques de fouille de données avancée (dont l'objectif est l'acquisition de bases théoriques et conceptuelles pour comprendre l'état de l'art, les possibilités et le limites des techniques existantes). 4- Les outils de modélisation pour l'aide à la décision (dont l'objectif est la connaissance des problèmes et techniques de modélisation des systèmes complexes ainsi que des bases sur prise de décision et l'aide à la décision.)

/ 21

Les grands blocs d’enseignement

1. Information et données

1.1 Données : introduction et formalisme XML

1.2 Bases de données et entrepôts de données

1.3 Web sémantique : introduction

1.4 Web sémantique : approfondissements

2. Algorithmique et programmation

2.1 Algorithmique

2.2 Programmation

3. Intelligence Artificielle : les bases

3.1 Logique et raisonnement

3.2 Résolution de problèmes et décisions

3.3 Apprentissage artificiel et fouille de données

3.4 Intelligence Artificielle Distribuée

4. Intelligence artificielle : approfondissements

4.1 Apprentissage artificiel et fouille de données : approfondissements

4.2 Intelligence Artificielle Distribuée : approfondissements

5. Formation humaine

5.1 Projet professionnel

5.2 Anglais

13IODAA – Informations générales

+ Des projets « fil rouge »

• Algorithmique et programmation

• Apprentissage artificiel et fouille de données

• Web sémantique

+ Des conférences

Acteurs du monde économique

+ Des exposés entre vous

Sur la décision, ses facteurs, les biais et les méthodes

/ 21

UE communes avec le Master ISI

• Volume : Environ 132h

• Lieu : Essentiellement à Dauphine

– Contact administratif : Valérie Lamauve ([email protected])

– Contact pédagogique : Antoine Cornuéjols (co-responsable du Master)

• Contrôle des connaissances et validation

– UE 3.3, 3.4, 4.1, 4.2 … : Dauphine

– Validation d’une UE et du stage : note ≥ 10

14IODAA – Informations générales

/ 21

Obtention du diplôme IODAA

• UEs organisées par AgroParisTech

– UEs : Compensation possible entre les UEs d’un même bloc (note ≥ 10)

– Stage : règlement de AgroParisTech(voir document)

• UEs organisées par Dauphine

– UEs 3.3, 3.4, 4.1, 4.2 …

– Validation d’une UE : note ≥ 10

15IODAA – Informations générales

/ 21

Obtention du double diplôme IODAA + M2 ISI

• UEs organisées par AgroParisTech

– Prise en compte des notes des UEs 1.1, 1.2, 3.1 et 3.2

• UEs organisées par Dauphine

– UE 3.3, 3.4, 4.1, 4.2 …

– Validation d’une UE : note ≥ 10

– Stage

• Sujet à valider par enseignants du M2 ISI

• Jury du M2 ISI

• Note ≥ 10

16IODAA – Informations générales

/ 21

Métiers visés

/ 21

Secteurs d’activités

• Les grands groupes (Danone, EDF, SAS, …)

• Les PME avec activité d’innovation

• Les grands laboratoires

– Publics (INRA, CNRS, INRIA, Universités, Grandes Écoles, …)

– Privés (EDF, Orange Labs, Xerox, …)

• Les développeurs de solutions informatiques

• …

18IODAA – Informations générales

/ 21

Métiers visés

– Grosses entreprises : marketing, prospective, gestion client (EDF, Peugeot, Air France, Danone, Nestlé, L'OREAL, Carrefour, Suez-Lyonnaise des Eaux, AGF, ...)

• Spécialistes de Customer Relationship Management(CRM), …

– Organismes internationaux d'étude d'évolution de l'environnement, ... (GIEC, ONU, ...) ; Directions Départementales (Equipement, Agriculture, ...)

• Gestion de données, aide à la décision, veille technologique

– Recherche et Enseignement (INRA, INRIA, CNRS, Laboratoires et universités)

– Entreprises d’édition spécialisées dans l’informatique décisionnelle (SAS, Oracle, A2IA, ...)

• Développeurs spécialisés, chefs de projet, managers

– SSII et cabinets d’audit spécialisés dans l’informatique décisionnelle• Chefs de projet, chargés d'études "data manager", consultants

http://www.decideo.fr/ (forum spécialisé)

/ 21

Le stage

• Période : 1er mars – 30 août

• Nature du sujet / travail

– IODAA : travail d’ingénieur• Prise en charge d’un projet conséquent (pas multitude de missions)• Une certaine autonomie de décision• Réalisation en partie informatique

– IODAA + M2 ISI• Travail de recherche et développement

– demander une solution innovante, c'est-à-dire qui ne soit pas la simple application de recettes connues.

– avoir une phase d'analyse du problème puisqu'il n'a pas de solution déjà bien connue

– prendre en compte de l'état de l'art sur le même type de problèmes pour comprendre les grands principes des solutions développées ailleurs dans des contextes différents mais similaires

– développer la méthode finalement retenue

– la tester de manière systématique

– chercher en conclusion à montrer en quoi la solution développée est généralisable, et sous quelles conditions, à d'autres problèmes similaires

20IODAA – Informations générales

/ 21

Conclusion

• Une formation transversale

– Utile dans tous les secteurs d’activité

– Complémentaire de votre parcours jusque là

• Extrêmement recherchée

– Énormément de projets passionnants

– Carrières diversifiées

21IODAA – Informations générales

/ 21

Sujets de stage

• EADS (Toulouse) recherche un(e) stagiaire pour une durée de 5 ou 6 mois

• .Vous serez au sein de l'équipe Intelligent and semantic systems du centre commun de recherche d'EADS (EADS Innovation works).Les compétences de cette équipe pluridisciplinaire et transnationale sont liées à l'intelligence artificielle, la fouille de données, la gestion des connaissances, les technologies issues du web sémantique, le traitement de l'information, du langage naturel, les méthodes d'innovation et enfin la modélisation des interactions homme-machines.

• Les finalités de l'équipe sont le développement :- d’applications intelligentes pour la maintenance utilisant destechniques d'apprentissage,- de méthodes avancées pour favoriser l'innovation, l'aide à la décision et l'optimisation pendant les phases de conception,- de méthodes et d'outils permettant la découverte, la capture, le partage et la recherche d'information et de connaissances,- de méthodes de modélisation et de simulation des systèmes complexes avec un axe particulier sur la modélisation et la simulation des interfaces hommes machines.

• Cette offre de stage est à pourvoir à compter du 3 janvier 2012 (sujette à une certaine flexibilité).

• Tâches & Activités Vous aurez, comme mission principale le développement de méthodes permettant la découverte, la capture, le partage et la recherche d'information et de connaissances.

• Vos compétences Vous êtes en dernière année d’école d’ingénieur, en master ou université (5ème année) et êtes spécialisé(e) en informatique.Vous avez des connaissances en :- système d’information,- traitement du langage naturel,- web sémantique,-ontologies.

• Vous savez travailler en équipe et avez d’excellentes qualités relationnelles.

• Anglais : niveau intermédiaire.

/ 21

Stages et embauches

• Stage ingénieur data mining, évolutif vers CDI (h/f)

• Ubiflow - apporteur d'audience - propose des solutions innovantes de diffusion d'annonces sur internet. Nous avons pour mission d’organiser la transparence d’univers professionnels en facilitant la transmission d’informations (annonces) des vendeurs aux consommateurs.Grâce à notre plate-forme, nous proposons une mise à jour automatique quotidienne des flux d’informations : petites annonces, catalogue produits, promotions… quels que soient le nombre et la complexité.

• Dans le cadre de notre développement, nous recherchons un ingénieur stagiaire pour choisir, configurer et intégrer un outil de data mining.

• Sujet de stage : data mining Ubiflow accumule depuis un dizaine d'année quantité d'informations sur les annonces, sur ses clients, sur son marché, sur la concurrence, mais également sur ses projets, son activité... De plus, nous souhaitons disposer d'indicateurs fiables de notre activité, en se basant sur nos données centralisées, afin de prendre les décisions avec un bon niveau de visibilité. Le stage consiste en l'élaboration d'un cahier des charges, la recherche de l'outil adapté, la rédaction de spécifications fonctionnelles et techniques, l'installation, l'intégration, la configuration, le développement d'adaptations, le test, la recette et la mise en production de la solution.