Download - Isaac referentiels-ist12-121002051942-phpapp01

Transcript
Page 1: Isaac referentiels-ist12-121002051942-phpapp01

Référen'els  et  interoperabilité  (1)  

Antoine  Isaac  

Europeana  &  Vrije  Universiteit  Amsterdam  

Séminaire  INRIA  IST  Carnac,  2  Octobre  2012  

Page 2: Isaac referentiels-ist12-121002051942-phpapp01

Aver'ssement  !  

•  Le  web  de  données  ne  matérialise  pas  la  no'on  de  “référen'el”  Tout  comme  le  web  “tradi'onel”:  techniquement  rien  ne  dis'ngue  un  

“site  de  référence”  d’un  autre  

•  Mais  il  y  a  quand  même  des  ressources  qui  peuvent  prétendre  au  statut  de  référence  pour  une  ou  plusieurs  communautés  

Page 3: Isaac referentiels-ist12-121002051942-phpapp01

Catégories  de  référen'els  possibles  

Inspira'on:  rapports  du  groupe  d’incuba'on  du  W3C  “Bibliothèques  et  web  de  données”  

•  Élements  de  métadonnées  

•  Vocabulaires  de  valeurs  

•  Jeux  de  données  

hVp://www.w3.org/2005/Incubator/lld/XGR-­‐lld-­‐vocabdataset/  

Page 4: Isaac referentiels-ist12-121002051942-phpapp01

Des  catégories  pas  forcément  disjointes?  

“Ontologie”  a  pu  être  u'lisé  pour  divers  “référen'els  séman'ques”  

[Smith 2001]

Page 5: Isaac referentiels-ist12-121002051942-phpapp01

Des  catégories  pas  forcément  disjointes?  

•  Conceptuellement,  elles  expriment  “de  la  séman'que”  

•  Parfois  un  artefact  appar'ent  à  deux  catégories  

•  Mais  d’un  point  de  vue  technique  (seman'c  web  stack)  il  y  a  une  vraie  différence  

Page 6: Isaac referentiels-ist12-121002051942-phpapp01

Eléments  de  métadonnées  

A.k.a  ontologies  OWL,  metadata  element  sets  

•  Fournissent  les  classes  et  propriétés  qui  servent  de  support  à  l’expression  des  descrip'ons  

•  Types  d’ontologies  selon  la  portée  ontologie  noyau  vs.  ontologie  de  domaine  vs.  ontologie  d’applica'on  

Page 7: Isaac referentiels-ist12-121002051942-phpapp01

“Briques  de  construc'on”  des  graphes  RDF  

myMES:suject

myVV:Amsterdam

http://example.org/article1

myMES:Article

rdf:type

Page 8: Isaac referentiels-ist12-121002051942-phpapp01

Ontologies  par  “popularité”  sur  le  Linked  Data  Cloud  

http://www4.wiwiss.fu-berlin.de/lodcloud/state/#terms

Page 9: Isaac referentiels-ist12-121002051942-phpapp01

Dans  l’inventaire  Library  Linked  Data  

http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Metadata_Element_Sets

Page 10: Isaac referentiels-ist12-121002051942-phpapp01

Dublin  Core  

DCMI Metadata Terms

•  A l’origine, 15 éléments généraux pour tous types de documents dc:title, dc:creator, dc:coverage, dc:subject

•  Spécialisés en éléments plus spécifiques, avec par ex. domaines et ranges dcterms:spatial, dcterms:creator dcterms:Agent

•  Utilisable pour relier des resources, pas seulement des descriptions “à plat”

•  Effort communautaire

dublincore.org/  

Page 11: Isaac referentiels-ist12-121002051942-phpapp01

FOAF  

Friend  of  a  Friend  

•  Décrire  des  personnes  –  réseaux  sociaux,  pages  personnelles…  •  Porté  par  deux  personnes,  retour  d’expérience  des  u'lisateurs  •  Approche  très  pragma'que  

www.foaf-­‐project.org/  

Page 12: Isaac referentiels-ist12-121002051942-phpapp01

OAI-­‐ORE  

Open  Archives  Ini'a've  -  Object  Reuse  and  Exchange

•  Décrire des aggrégations de resources qui composent des ressources numériques complexes

•  Eléments clefs –  Aggrégation –  Ressource aggrégée –  “Proxy” –  “Resource map”

•  Communauté OAI cf. OAI-PMH

www.openarchives.org/ore/

Page 13: Isaac referentiels-ist12-121002051942-phpapp01

Bibo  

•  Bibliographic  Ontology  

•  Ontologie  pour  les  ressources  bibliographiques  –  Categorisa'on  de  documents  (AcademicAr'cle)  

–  Structure  des  documents  (chapter…)  

–  Cita'on  (citedBy)  •  Créée  par  deux  personnes  

bibliontology.com/  

Page 14: Isaac referentiels-ist12-121002051942-phpapp01

FRBR  

•  Modèle  conceptuel  développé  par  l’IFLA  

•  Il  existe  plusieurs  ontologies  (FRBRer,  FRBRcore,  FRBRoo)  

Page 15: Isaac referentiels-ist12-121002051942-phpapp01

Schema.org  •  Représenter  dans  les  pages  web  des  informa'ons  de  base  sur  

les  objets  qu’elle  représentent  Videos,  Volcans,  Sex  shops…  

•  Moteurs  de  recherche  (Bing,  Google,  Yahoo!)  

•  Approche  top-­‐down,  mais  très  pragma'que  

Page 16: Isaac referentiels-ist12-121002051942-phpapp01

Et  bien  d’autres…  

•  CIDOC-­‐CRM  

•  W3C  Media  Ontology  •  Music  Ontology  

…  

Page 17: Isaac referentiels-ist12-121002051942-phpapp01

Où  les  trouver  ?  

Rapports  

•  Library  Linked  Data  

Moteurs  de  recherche  

•  Sindice  •  Watson  

Répertoires  •  Linked  Open  Vocabularies  •  Open  Metadata  Registry  

www.w3.org/2005/Incubator/lld/XGR-­‐lld-­‐vocabdataset/  

sindice.com  watson.kmi.open.ac.uk/  

lov.okfn.org/dataset/lov/  metadataregistry.org  

Page 18: Isaac referentiels-ist12-121002051942-phpapp01

Linked  Open  Vocabularies  

Page 19: Isaac referentiels-ist12-121002051942-phpapp01

Etude  de  cas  :  la  créa'on  du  Europeana  Data  Model  

http://pro.europeana.eu/edm-documentation

Page 20: Isaac referentiels-ist12-121002051942-phpapp01

?  

Page 21: Isaac referentiels-ist12-121002051942-phpapp01

Europeana  

Service  qui  donne  accès  aux  objets  numérisés  du  domaine  patrimonial  européen  

•  Portail  liés  aux  portails  des  ins'tu'ons  et  projets  partenaires  

•  Services  de  données:    –  API  –  Linked  Data  

europeana.eu  

pro.europeana.eu/api  data.europeana.eu  

Page 22: Isaac referentiels-ist12-121002051942-phpapp01

Mn;kl;k;klj;lkj;lkj;jh;lkj;klj;klj;klj;klj

Qui  envoie  des  données  à  Europeana?  

APEnet

Archives

Libraries

Museums

National Aggregators

Regional Aggregators

Horizontal Aggregators Vertical Aggregators

The European Library

ATHENA

European Film Gateway

Film archives ELocal

GLAMs

Flanders museums

Culture Grid

GLAMs

“Dark” Aggregators

GLAMs

Page 23: Isaac referentiels-ist12-121002051942-phpapp01

Qu’est-­‐ce  qui  est  envoyé  à  Europeana?  

1. Thumbnails

2. Metadata

3. Links to digital objects online

Page 24: Isaac referentiels-ist12-121002051942-phpapp01

Résoudre  un  problème  d’intégra'on  de  données  

Construire  un  service  d’accès  u'lisant  les  métadonnées  est  difficile  

•  Chaque  domaine  u'lise  ses  propres  modèles  et  formats  LIDO,  EAD…  

•  Solu'on  actuelle:  les  partenaires  fournissent  des  métadonnées  au  format  Europeana  Seman'c  Elements  (ESE)    –  Plus  grand  commun  dénominateur  pour  les  métadonnées  

–  Données  “à  plat”  –  Ne  respectent  pas  le  “one-­‐to-­‐one  principle”  –  Perte  de  la  richesse  des  metadonnées  orginelles  

Page 25: Isaac referentiels-ist12-121002051942-phpapp01

Plus  de  “séman'que”  pour  l’accès  aux  objets  

Construire  une  “couche  séman'que”  au-­‐dessus  des  objets  

Page 26: Isaac referentiels-ist12-121002051942-phpapp01

Services  assistés  par  la  séman'que  

•  Exploita'on  de  rela'ons  comme:  “localisé  à”,  “a  pour  sujet”,  “concept  plus  générique”,  correspondences  entre  langues,  domaines  –  Reformula'on  de  requêtes  –  Regroupement  et  personnalisa'on  de  résultats  

•  Échanger  des  données  plus  riches  

•  Les  données  plus  riches  sont  souvent  déjà  là  !  –  Thesauri,  classifica'ons…  –  Éléments  de  données  complexes  (EAD,  MARC)  –  Dans  le  domaine  patrimonial  ou  ailleurs  

Page 27: Isaac referentiels-ist12-121002051942-phpapp01

EDM  design  requirements  

Données plus fines

•  Distinction entre l’"objet fourni (tableau, livre…) et ses représentations numériques

•  Distinction entre l’objet et ses descriptions •  Permettre plusieurs descriptions pour un objet

Contenant éventuellement des assertions contradictoires

•  Représentation d’objets complexes •  Ressources contextuelles, y compris concepts

Page 28: Isaac referentiels-ist12-121002051942-phpapp01

EDM  design  requirements  

Données plus interopérables

•  Permettre la co-existence de plusieurs grains de données Autoriser  des  profils  spécifiques  à  un  domaine  

•  Réutiliser et étendre des éléments de standards existants

Page 29: Isaac referentiels-ist12-121002051942-phpapp01

EDM  :  les  bases  

•  OAI ORE pour l’organisation des metadonnées et des représentations numériques des objets

•  Dublin Core pour une partie des metadonnées descriptives

•  CIDOC-CRM comme inspiration pour la structure des événements et des relations entre objets

•  SKOS et d’autres référentiels pour les ressources contextuelles

Page 30: Isaac referentiels-ist12-121002051942-phpapp01

Exemple  -­‐  1  

30  

Page 31: Isaac referentiels-ist12-121002051942-phpapp01

Exemple  -­‐  2  

31  

Page 32: Isaac referentiels-ist12-121002051942-phpapp01

Aggrega'ons  OAI  ORE    

32  

aggrega'on  

digital  representa'on  

object  

provenance  metadata  

organiser la “contribution” d’un partenaire

Page 33: Isaac referentiels-ist12-121002051942-phpapp01

Proxys  OAI  ORE  

33  

proxy  

object  metadata  

Représenter une “vue” sur les objets

Page 34: Isaac referentiels-ist12-121002051942-phpapp01

Plusieurs  fournisseurs  =  plusieurs  aggrega'ons  

34  

DMF  proxy  

Louvre  Proxy  

Louvre  'tle  

DMF  'tle  

The  “real”  pain'ng  

Page 35: Isaac referentiels-ist12-121002051942-phpapp01

Europeana  comme  un  “simple”  fournisseur  de  metadonnées  normalisées  et  enrichies  

35  

Europeana  aggrega'on  

“enriched”  metadata  

Page 36: Isaac referentiels-ist12-121002051942-phpapp01

En'tés  contextuelles  

Récupér et exploiter des données “orginelles” ou enrichies réclame plus que des descriptions centrées objet

Evénements, lieux, agents, concepts

Page 37: Isaac referentiels-ist12-121002051942-phpapp01

Objets  et  événements  

Page 38: Isaac referentiels-ist12-121002051942-phpapp01

EDM  est  un  effort  collabora'f  

•  Europeana v1.0 WP3: 60 participants

•  Développement semi-ouvert, “en aquarium”

•  Transversal –  Experts des bibliothèques, archives et musées –  Avec EDM, Europeana devient plus compatible avec les besoins de

communautés spécifiques. Il est aussi possible de créer des “profils” d’EDM pour ces communautés

Page 39: Isaac referentiels-ist12-121002051942-phpapp01

Bénéfices  de  l’approche  web  de  données  pour  la  concep'on  d’EDM  

•  Vocabulaires  à  réu'liser  •  Approche  flexible  de  la  concep'on  et  la  ré-­‐u'lisa'on  de  

standards  

•  Ontologies  spécifiques  co-­‐existant  avec  les  ontologies  standards  

•  Pas  de  contrainte  sur  le  grain  du  modèle  de  données  •  Facilité  technique  de  la  connec'on  et  la  publica'on  des  

données  •  Vision  qui  appuie  les  stratégies  Open  Data  

Page 40: Isaac referentiels-ist12-121002051942-phpapp01

Retour  aux  éléments  de  métadonnées    –  ou  presque  

Page 41: Isaac referentiels-ist12-121002051942-phpapp01

EDM  

41  

Elément  de  (méta)données  

Concept  d’un  vocabulaire  d’autorité  

Page 42: Isaac referentiels-ist12-121002051942-phpapp01

SKOS  

Simple  Knowledge  Organiza@on  System  

Portée:  knowledge  organiza'on  systems  (KOS)  comme  les  thesauri,  systèmes  de  classifica'on,  autorités  ma'ères…  

SKOS  permet  de  représenter  et  d’échanger  les  KOS  en  RDF  de  manière  simple  

Page 43: Isaac referentiels-ist12-121002051942-phpapp01

Représenter  la  séman'que  

La  manière  formalisée:  OWL  Seman'c  Web  ontology  language  

Ontologies  avec  une  séman'que  exploitable  par  la  machine  

•  Mère est  une  classe  •  C’est  l’intersec'on  des  classes  Femme et  Parent!•  Parent est  la  classe  des  ressources  de  type  Personne qui  

sont  liés  à  au  moins  une  autre  ressource  de  type  Personne en  u'lisant  la  propriété    estParentDe  

…  

Page 44: Isaac referentiels-ist12-121002051942-phpapp01

SKOS  n’est  pas  pour  des  ontologies  formelles  

•  Il  est  possible  de  produire  des  ontologies  à  par'r  de  KOS,  mais  les  KOS  –  Se  concentrent  souvent  sur  les  données  lexicales    

Enfant U'liséPour  Progéniture!

–  Ont  une  séman'que  plus  “molle”  Parent TermeLié  Enfant!

–  Sont  parfois  gigantesques  et  donc  difficiles  à  “neVoyer”  

•  Et  pourtant  en  tant  que  tels  les  KOS  peuvent  être  u'les  à  de  nombreuses  applica'ons!  Recherche  séman'que,  annota'on…  

Page 45: Isaac referentiels-ist12-121002051942-phpapp01

Séman'que  et  interopérabilité  

SKOS  –  les  bases  

Pour  sa'sfaire  la  majorité  des  besoins  

•  Concepts  •  Propriétés  lexicales  •  Liens  séman'ques    •  Notes    

Page 46: Isaac referentiels-ist12-121002051942-phpapp01

Un  thesaurus  fic'f  

Animals

cats UF (used for) domestic cats RT (related term) wildcats BT (broader term) animals SN (scope note) used only for domestic cats

domestic cats USE cats

wildcats

Page 47: Isaac referentiels-ist12-121002051942-phpapp01

Concepts  et  libellés  

cats UF (used for) domestic cats

skos: = http://www.w3.org/2004/02/skos/core# rdf: = http://www.w3.org/1999/02/22-rdf-syntax-ns# ex: = http://example.org/

Page 48: Isaac referentiels-ist12-121002051942-phpapp01

Libellés  mul'lingues  

Page 49: Isaac referentiels-ist12-121002051942-phpapp01

Rela'ons  séman'ques  

cats RT (related term) wildcats BT (broader term) animals

Page 50: Isaac referentiels-ist12-121002051942-phpapp01

Un  graphe  SKOS  animals cats

UF domestic cats RT wildcats BT animals SN used only for domestic cats

domestic cats USE cats

wildcats

Page 51: Isaac referentiels-ist12-121002051942-phpapp01

Changement  par  rapport  aux  approches  tradi'onelles  

•  Approche  orientée  concepts  •  Plus  de  fron'ère  “dure”  entre  vocabulaires  

Extension  &  alignement  sont  facilités  à  travers  différents  contextes  

•  L’u'lisa'on  de  plusieurs  vocabulaires  dans  une  applica'on  est  facilitée  

•  Transi'on  vers  une  interoperabilité  plus  grande  avec  tous  types  de  jeux  de  données  

Page 52: Isaac referentiels-ist12-121002051942-phpapp01

Extensions  de  SKOS  

•  MADS/RDF  Autorités-­‐ma'ères  (LCSH)  

France –– Histoire –– XXeme siècle

•  ISO25964  (en  cours)  Thesaurus  «  classiques  »  

–  Coumpound  equivalences:  

Charbonnages USE Charbon + Mines –  Arrays:  Chaises

<Chaises par forme>

Fauteuils

Page 53: Isaac referentiels-ist12-121002051942-phpapp01

SKOS  vs.  OWL  –  rappel  

•  Il  y  a  vraiment  une  différence  entre  les  deux  approches  Les  ressources  SKOS  (les  concepts)  sont  des  instances  de  classes  au  sens  

de  OWL  (instances  de  skos:Concept).  Elles-­‐mêmes  ne  sont  pas  des  classes  par  défaut.  

•  Des  ontologies  comme  SKOS  existent  pour  porter  et  exploiter  sur  le  web  de  données  des  données  séman'ques  “tradi'onelles”  sans  avoir  à  la  conver'r  (et  les  neVoyer)  en  ontologies  OWL  

Page 54: Isaac referentiels-ist12-121002051942-phpapp01

Vocabulaires  de  valeurs  

Terminologie  du  groupe  LLD  

 Regroupe  vocabulaires  contrôlés,  vocabulaires  d’autorités,  mais  aussi  poten'ellement  des  folksonomies…  

SKOS  est  une  ontologie  qui  permet  de  publier  un  semble  de  ressources  d’autorité,  référen'els  provenant  des  bibliothèques  ou  bien  d’autres  domaines  

Page 55: Isaac referentiels-ist12-121002051942-phpapp01

http://www.w3.org/2001/sw/wiki/SKOS/Datasets

Page 56: Isaac referentiels-ist12-121002051942-phpapp01

http://thedatahub.org/dataset?q=format-skos

Page 57: Isaac referentiels-ist12-121002051942-phpapp01

http://www.w3.org/2005/Incubator/lld/XGR-lld-vocabdataset/#Value_vocabularies

Page 58: Isaac referentiels-ist12-121002051942-phpapp01

DBpedia,  Freebase?  

•  Le  web  de  données  efface  la  fon'ère  technique  entre  vocabulaire  d’autorité  et  «  simples  »  jeux  de  données  

•  Des  ressources  SKOS  peuvent  être  liées  à  des  ressources  différentes  Par  ex.  une  personne  et  le  «  concept  d’une  personne  »  dans  un  fichier  

d’autorité  

•  Un  jeu  de  données  peut  devenir  un  référen'el  

Page 59: Isaac referentiels-ist12-121002051942-phpapp01

Linked  Library  Data  

hVp://www.w3.org/2005/Incubator/lld/XGR-­‐lld-­‐vocabdataset/  

Page 60: Isaac referentiels-ist12-121002051942-phpapp01

Jeux  de  données  

•  Dans  le  domaine  bibliographique  –  Catalogues  de  bibliothèques  na'onales  –  Services  documentaires  spécialisés  

Page 61: Isaac referentiels-ist12-121002051942-phpapp01
Page 62: Isaac referentiels-ist12-121002051942-phpapp01

Jeux  de  données  a  réu'liser  et  lier  

•  Ressources  d’intérêt  bibliographique  sur  le  Data  Hub  thedatahub.org/group/lld    

•  Linked  Open  Data  Cloud  sur  le  Data  Hub  thedatahub.org/group/lod      

•  Moteurs  de  recherche  sur  le  Linked  Data  Cloud  

Sindice.com  

Page 63: Isaac referentiels-ist12-121002051942-phpapp01

Merci  !  

Remerciements  par'culiers:  •  Equipe  et  partenaires  Europeana  •  Membres  du  groupe  Library  Linked  Data  

[email protected]