Territoires, Environnement, Télédétection et Information Spatiale
Unité Mixte de Recherche AgroParisTech - Irstea - Cirad
Gestion massive des données
Mathieu Roche (Cirad)Maguelonne Teisseire (Irstea)
Journees 2014 du Labex Agro
2
Big Data
Les 3VVolume
Dans le contexte des recherches à TETIS :
- Données images : aujourd’hui une dizaine d’images par an (satellites SPOT, Landsat, etc.), une image tous les 5 jours d’ici trois ans (Sentinel-2)
- Autres données (textes, numériques, etc)
3
Big Data
Les 3V
Volume• Données massives
Variété• Données hétérogènes « syntaxiquement » et « sémantiquement »
Vélocité• Données disponibles par flux
… et d'autres V
Versatilité, Véracité, Visualisation, Valorisation, Vivification, etc.
=> creation d'un GdR CNRS autour de cette thematique
Processus :
collecte des données (acquisition, indexation, qualité, etc.),
accès aux données/informations (interrogation, visualisation, etc.),
exploration des données/informations/connaissances (intégration, analyse, fouille de données)
Quels types de données ?
Big Data et traitement
5
Images
Images satellitaires Vers une mise à disposition de gros volume de données… mais peu de
méthode d’analyse ! Fouille d’images satellites (Remote Sensing Image Mining) avec une
perspective temporelle et spatiale encore peu explorée
6
Quelles données/informations utiliser ?
Informations radiométriques, texturales et temporelles
- Carte culture / non culture- Distance au village- Taille de la parcelle- etc.
Informations statiques
TELEDETECTION TERRAIN
BD Terrain :- Relevés parcellaires- Contour GPS- Culture au sol- Itinéraire technique…
Typologie des systèmes de cultureClasse A : riz irriguéClasse B : riz pluvial de tavy (colline)Classe C : maïsClasse D : manioc…
SPOT date n(10 – 20 m)
Pleaides(mono-date)(0.7 m)
SPOT date 1
SPOT date 2SPOT date 3
7
Fouille d'images
Détection automatique de dynamiques spatio-temporelles à partir de séries d’images satellitaires
Fusion d'images satellitaires pour la production de séries temporelles d’images à résolution spatiale élevée
8
Combinaison images et textes
Projet Animitex (CNRS Mastodons)Exploiter des données textuelles massives et hétérogènes permettant de compléter l’analyse des images satellitaires
Contexte Limite des algorithmes de classification pour une analyse fine des images
(par exemple, distinguer les types de cultures, fonction des batiments, etc.) Investissement humain conséquent
9
Fouille données textuelles hétérogènesProjet Senterritoire (MSH-M) 2ème phase ANR 2014
La perception de l’aménagement d’un territoireLa perception de l’aménagement d’un territoire
1ère Phase
Extraction des entités spatiales
2ème Phase
Identification des opinions des acteurs
E. Kergosien, B. Laval, M. Roche, M. Teisseire: Are opinions expressed in land-use planning documents? International Journal of Geographical Information Science 28(4): 739-762 (2014)
10
Fouille données textuelles hétérogènes
La fouilles de textes pour l'agriculture
Veille épidémiologique
Collaboration UMR CMAEE (Controle des maladies animales, exotiques et émergentes)
Extraction d'information dans les ressources bibliographiques
Collaboration avec l'UMR IATE (Ingénierie des Agro-polymères et Technologies Émergentes)
Methodologie :
Processus : Acquisition de données, recherche d'information, extraction d'information (combinaison d'approches linguistiques et statistiques)
11
Conclusion
Top Related