Profil d'application AI

24
Le profil d'application "Archives institutionnelles" Journées Couperin AO 3 avril 2009

Transcript of Profil d'application AI

Page 1: Profil d'application AI

Le profil d'application"Archives institutionnelles"

Journées Couperin AO3 avril 2009

Page 2: Profil d'application AI

Point de départ

Journées Couperin AO3 avril 2009

Page 3: Profil d'application AI

Journées Couperin AO - 3 avril 2009 3

Point de départ

Concevoir un format de métadonnées :

Répondant aux besoins des établissements en

matière de description des publications

scientifiques

Compatible avec le format de métadonnées de

HAL

Page 4: Profil d'application AI

Journées Couperin AO - 3 avril 2009 4

Point de départ Objectifs :

Permettre à chaque établissement de décrire au sein de son archive institutionnelle les publications scientifiques qu'il produit (besoin partagé par les établissements d'autres pays) :

Pouvoir avoir des informations sur la production d'une entité (laboratoire...) Pouvoir avoir des informations sur les droits liés aux ressources Pouvoir avoir des informations sur le contexte de publication de la

ressource

au moyen d’un format compatible avec les standards internationaux.

Permettre les échanges : Avec HAL ; Entre archives institutionnelles des établissements français ; Avec les archives institutionnelles, nationales et thématiques des autres

pays.

Page 5: Profil d'application AI

Journées Couperin AO - 3 avril 2009 5

Point de départ Les besoins des établissements :

Décrire la publication avec des données bibliographiques

standards et complètes

Décrire les liens entretenus par la publication avec des

agents (auteurs, éditeurs, organismes d'affiliation, tutelles...)

à l'instant T du référencement de la publication

Identifier ces agents et permettre le lien avec une

application de gestion de la recherche

Décrire le statut juridique de la publication et les éventuelles

restrictions d'accès

Page 6: Profil d'application AI

Journées Couperin AO - 3 avril 2009 6

Point de départ

Les besoins des établissements (suite)

Identifier le contexte de la publication :

« document hôte » dans le cas de regroupement de type actes,

revues,

autres publications dans la même archive ou dans une autre archive

Identifier si nécessaire l'événement qui a été l'occasion de

la publication.

Page 7: Profil d'application AI

AI (Archives Institutionnelles) un profil d'application du Dublin Core

Journées Couperin AO3 avril 2009

Page 8: Profil d'application AI

Journées Couperin AO - 3 avril 2009 8

Pourquoi un profil d'application du Dublin Core ?

Limite des formats existants :

Le Dublin Core, simple ou qualifié, ne répond pas à l'ensemble des besoins décrits plus haut. C'est un format générique.

Les formats créés dans d'autres pays sont trop fortement liés à leurs contextes nationaux.

La réponse du Dublin Core Metadata Initiative : le modèle abstrait du Dublin Core (DCAM)

Page 9: Profil d'application AI

Journées Couperin AO - 3 avril 2009 9

Le modèle abstrait du Dublin Core (DCAM)

Le DCAM est un cadre conceptuel complexe qui permet :

de décrire des éléments d'information (métadonnées) et leur structuration

indépendamment des syntaxes d'encodage

pour développer des profils d'application (i. e. modèles conceptuels ancrés dans un contexte précis) fondés sur les termes DCMI ou d'autres ensembles de termes compatibles

Page 10: Profil d'application AI

Journées Couperin AO - 3 avril 2009 10

Du modèle abstrait au profil d'application

La problématique du GTAO rencontre pleinement celle qui a présidé à l'émergence de la notion de profil d'application du Dublin Core, i. e. répondre à la tension qui existe entre : d'une part les besoins spécifiques de chaque

communauté et d'autre part la nécessité de l'interopérabilité

"The term application profile has been applied to describe the tailoring of standards for specific applications."

The Singapore Framework for Dublin Core Application Profiles - http://dublincore.org/documents/singapore-framework/

Page 11: Profil d'application AI

Journées Couperin AO - 3 avril 2009 11

Qu'est-ce qu'un profil d'application du Dublin Core (DCAP) ?

Un "Lego" permettant d'assembler des éléments issus de différents standards pour créer un nouveau standard répondant à des besoins spécifiques.

Un standard qui repose sur un cadre conceptuel complexe, le modèle abstrait du Dublin Core (DCAM), lui-même fondé sur les principes du RDF (la "langue" du web sémantique).

Une autre manière de concevoir les métadonnées.

Page 12: Profil d'application AI

Journées Couperin AO - 3 avril 2009 12

Un exemple de DCAP : SWAP

SWAP (ex-EAP) = Scholarly Works Application Profile :

Un profil d'application du Dublin Core pour la description de documents académiques

Un projet du groupe "Digital Repositories" du JISC entamé en 2006

Validé par le DCMI Usage Board en 2009

Basé sur les FRBR (Functional Requirements for Bibliographic Records)

Page 13: Profil d'application AI

Journées Couperin AO - 3 avril 2009 13

Un exemple de DCAP : SWAP

Pourquoi AI et pas SWAP ? SWAP n'est pas adapté au contexte français. SWAP et AI ont la même base : le Dublin Core. Ils sont

en quelque sorte deux « vues » de la description des publications scientifiques à l'aide de profils d'application du Dublin Core.

Les apports de SWAP à AI : Un exemple concret de profil d'application Un standard auquel on peut emprunter certaines

métadonnées et des vocabulaires

Page 14: Profil d'application AI

Journées Couperin AO - 3 avril 2009 14

Comment ça marche ?

Les règles de conception d'un DCAP sont décrits dans le Singapore Framework*.

5 composantes : 3 obligatoires :

Spécifications fonctionnelles : pour quel usage est créé le profil d'application ?

Modèle entités-relations : les composants de base du DSP Profil des ensembles de description (Description Set Profile ou

DSP) : le cœur du DCAP

2 optionnels : Recommandations d'usage Recommandations sur les syntaxes d'encodage : un profil

d'application n'est pas un schéma XML mais un modèle abstrait permettant d'écrire des schémas XML ou autres.

* The Singapore Framework for Dublin Core Application Profiles

http://dublincore.org/documents/singapore-framework/

Page 15: Profil d'application AI

Journées Couperin AO - 3 avril 2009 15

Les grands principes du DCAM

Le principe de base de RDF et du DCAM : le triple

Un triple est une phrase simple :

Sujet – Verbe – Complément Sujet = ressource Verbe = propriété ou prédicat Complément = valeur

→ Ressource – Propriété – Valeur

Ex : "La ressource dont l'URI est XXX a pour auteur Tintin"

peut se traduire en rdf :

XXX dc:creator « Tintin »

Page 16: Profil d'application AI

Journées Couperin AO - 3 avril 2009 16

Les grands principes du DCAM

Le « complément » (la valeur) peut elle-même être décrite par un triple.

Ressource XXX

Tintin

[email protected]

dc:creator

foaf:mbox

triple représenté dans un graphe :1 nœud – 1 arc – 1 nœud

Utilisation de termes issues de différents formats

Page 17: Profil d'application AI

Journées Couperin AO - 3 avril 2009 17

Les grands principes du DCAM :

La structure du DCAM :

Un enregistrement est un ensemble de descriptions

Un ensemble de descriptions comprend une ou plusieurs descriptions

Une description comprend une ou plusieurs déclarations

Une déclaration est un triple

Page 18: Profil d'application AI

Journées Couperin AO - 3 avril 2009 18

Les grands principes du DCAP

Les principes du DCAP :

Le modèle entités-relations Chaque entité décrite dans le modèle entités-relations peut être

le sujet d'une description Les différentes descriptions sont liées entre elles par les

relations décrites dans le modèle entités-relations

Le modèle entités-relations me permet de dire de quoi je parle.

Page 19: Profil d'application AI

Journées Couperin AO - 3 avril 2009 19

Les grands principes du DCAP

Les principes du DCAP : Le Description Set Profile :

Il décrit le contenu autorisé pour les éléments composant un enregistrement (ou "description set") : descriptions, déclarations, valeurs

Il peut être écrit à l'aide de différentes syntaxes : DC-Text, XML, RDF...

Le DSP me permet de contrôler ce que je dis sur les composants du modèle entités-relations

Page 20: Profil d'application AI

Le profil d'application AI

Journées Couperin AO3 avril 2009

Page 21: Profil d'application AI

Journées Couperin AO - 3 avril 2009 21

AI : spécifications fonctionnelles Le Profil d'Application AI et son environnement

Interopérabilité (avec HAL – avec d'autres archives institutionnelles – au sein du système d'information de l'établissement)

Conformité avec les standards

Adaptabilité (ouverture aux évolutions du web)

Le Profil d'Application AI et les documents décrits Fonctionnalités de recherche (recherche sur n'importe quel

élément d'indexation, repérage des ressources en texte intégral...)

Identification des auteurs et des affiliations (expression des affiliations des auteurs, recours à des formes d'autorités locales ou nationales...)

Gestion des droits (information sur les droits liés aux ressources)

Page 22: Profil d'application AI

Journées Couperin AO - 3 avril 2009 22

AI : modèle entités-relations et index des entités et de leur propriété (ébauche du DSP)

Page 23: Profil d'application AI

Journées Couperin AO - 3 avril 2009 23

Les livrables

L'objectif est de fournir à la communauté des établissements d'enseignements supérieur un profil d'application complet, avec des exemples de syntaxes d'encodage et des recommandations d'usage.

L'intégration du profil d'application AI dans les applications gérant les archives institutionnelles pourra se faire en se fondant sur ces exemples de syntaxe d'encodage ou en adoptant une autre syntaxe.

Page 24: Profil d'application AI

Journées Couperin AO - 3 avril 2009 24

Le bilan

Le travail du GTAO sur le profil d'application AI a dépassé la commande initiale.

Des perspectives intéressantes sont ouvertes par ce travail prospectif qui pourra bénéficier à l'ensemble de la communauté : Vers une convergence entre AI et TEF, deux formats

amenés à être utilisés simultanément par les archives institutionnelles des établissements d'enseignement supérieur ?