Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène...
-
Upload
elisabeth-bazin -
Category
Documents
-
view
104 -
download
0
Transcript of Une grille pour larchivage intermédiaire et à long terme des données numériques en SHS Lorène...
Une grille pour l’archivage intermédiaire et à long terme des données numériques en SHS
Lorène Béchard / Philippe Prat [email protected] / [email protected]
Journées OAIS pour l’archivage de la recherche en SHS
23-24 octobre 2012
Centre Informatique National de l’Enseignement Supérieur
Le Centre Informatique National de l’Enseignement Supérieur
2Journées OAIS23-24 octobre 2012
Centre Informatique National de l’Enseignement Supérieur
• Basé à Montpellier (Hérault, France)
• EPA créé en 1999, succédant au CNUSC (Centre National Universitaire Sud de Calcul) – créé en 1980
• Placé sous la tutelle de la DGRI (Direction Générale de la Recherche et de l’Innovation) et de la DGESIP (Direction Générale pour l’Enseignement Supérieur et l’Insertion Professionnelle) du Ministère de l’Enseignement Supérieur et de la Recherche
• Missions
– Calcul numérique intensif
– Archivage pérenne de documents électroniques
Activité transversale : hébergement d'environnements informatiques
• Plus d’information : http://www.cines.fr/
Centre Informatique National de l’Enseignement Supérieur
3Journées OAIS23-24 octobre 2012
• PAC : archivage intermédiaire et à long terme de données administratives, patrimoniales et scientifiques– Mandat pour l’archivage des thèses électroniques soutenues en France (arrêté du
7 août 2006)
– Agréé pour l’archivage intermédiaire par le SIAF
– Périmètre opérationnel : données de l’enseignement supérieur et de la recherche
– Partenariat avec le TGE Adonis : archivage et diffusion des données numériques en SHS
• ISAAC : archivage intermédiaire de données scientifiques– Dimensionné pour des petites structures ayant de grands volumes de données
– Une donnée organisée et validée par des communautés d’experts
– Un travail scientifique valorisé par le partage et la diffusion
L’archivage numérique au CINES : deux approches, deux infrastructures
Centre Informatique National de l’Enseignement Supérieur
4
Le service d’archivage pérenne du CINES
PAC : une plateforme d’archivage électronique + un service dédié de 11 personnes
– Une solution générique basée sur les normes et standards du domaine :
• Qualité technique (métadonnées, fichiers, stockage)
• Qualité organisationnelle (processus métiers, gestion des risques, certification)
– Une solution mutualisée et sécurisée
– Des contrôles à tous les niveaux : versement / stockage / communication
– Une démarche qualité basée sur des audits réguliers et l’obtention d’une certification
– En production depuis 2008 (PAC v2) – 10 services versants – 23 To archivés
Dans le respect du contexte législatif et archivistique français
Journées OAIS23-24 octobre 2012
Centre Informatique National de l’Enseignement Supérieur
L’architecture logique de la plateforme PAC
5
PAC : Plateforme d’archivage du CINES
Serveurde
Transfert
Serveurde
Stockage
Serveurd’Accès
Producteur Service Versant
Administrateur
Utilisateur
Service de Contrôle
Journées OAIS23-24 octobre 2012
Centre Informatique National de l’Enseignement Supérieur
Zoom sur… l’expertise en formats de fichier
6
Pour permettre le contrôle de la qualité d’un fichier, celui-ci doit être dans un format identifié et vérifiable :
– Format publié ; ex. WAV, SVG ;
– Format largement utilisé ; ex. XML, MPEG4 ;
– Format normalisé si possible ; ex. PDF (ISO 32000-1:2008), PNG (ISO 15948:2004).
Pour pouvoir être lisibles dans le temps et convertibles, les fichiers doivent respecter à la lettre les spécifications de leur format.
Les outils libres Jhove, ImageMagick, DROID, ODF Validator permettent une identification, validation et caractérisation des formats.
Type Format
Texte HTML, PDF, TXT, XML, ODT
Image GIF, JPEG, TIFF, PNG, SVG
Audio WAV, AIFF, AAC, VORBIS
Vidéo MPEG4, THEORA, MKV
Journées OAIS23-24 octobre 2012
Centre Informatique National de l’Enseignement Supérieur
Deux partenaires : le CINES et le TGE Adonis
• Le TGE Adonis est l’interlocuteur des laboratoires et des structures demandant à bénéficier de l’archivage à long terme– Il labellise des projets de conservation à long terme de documents numériques
• Le CINES est l'opérateur qui assure la conservation, la pérennisation et les migrations futures
Les données sont d’abord déposées au CINES qui vérifie notamment la conformité des fichiers à des formats de conservation définis à l'avance
– Accompagner la mise en forme des données pour l’archivage– Garantir la lisibilité et la compréhension sur le long terme– Faciliter la démarche d’assurance qualité de l’archivage
• Le TGE Adonis assure l’accès aux donnéesLes données communicables sont accessibles depuis la plateforme de diffusion mise en
place et gérée par le TGE Adonis
Le projet d’infrastructure mutualisée pour l’archivage et la diffusion des données SHS
7Journées OAIS23-24 octobre 2012
Centre Informatique National de l’Enseignement Supérieur
8
Plateforme d’Archivage
Transfert
Synchronisation
Synchronisation
Système de diffusion /
communication
Conversions Formats
Infrastructure Mutualisée
(Grille de Données)
L’infrastructure mise en place
Journées OAIS23-24 octobre 2012
Centre Informatique National de l’Enseignement Supérieur
Les objectifs du projet « pilote » CRDO
• Valider le schéma retenu pour les données orales, sur le plan– Des fonctionnalités d'ensemble– De la répartition des tâches et des responsabilités entre les acteurs
• Prouver la possibilité d’extension aux autres données des SHS créées, gérées et utilisées par différents Centres de Ressources Numériques
Le bilan du projet « pilote » CRDO
• La plateforme est en production depuis Mars 2010– Au 31 Décembre 2011, près de 4000 documents multimédia versés– Respect des normes du domaine (OAIS – ISO14721, etc.)
• Bilan du « pilote » validé par le Conseil Scientifique du TGE ADONIS en Septembre 2010
• Agrément SIAF obtenu par le CINES le 14 Décembre 2010
Les perspectives
• Extension de l’infrastructure à d’autres services et laboratoires
Le projet pilote du CRDO : bilan et perspectives
9Journées OAIS23-24 octobre 2012