Les ¢« Biblioth£¨ques Virtuelles Humanistes ......

download Les ¢« Biblioth£¨ques Virtuelles Humanistes ... Exp£©riment£© pour le site BVH depuis le 22 juillet

of 91

  • date post

    28-Jan-2020
  • Category

    Documents

  • view

    0
  • download

    0

Embed Size (px)

Transcript of Les ¢« Biblioth£¨ques Virtuelles Humanistes ......

  • Les « Bibliothèques Virtuelles Humanistes »

    Vers un centre de ressources numériques Textes Imprimés PatrimOniaux (TIPO)

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    Textes Imprimés PatrimOniaux (TIPO)

    Université d’hiver Adonis-Valpré– 6-8 décembre 2010

    http://www.bvh.univ-tours.fr

  • Le Centre d’Études Supérieures de la Renaissance à Tours: une UMR et une UFR

  • • Les mots-clés des humanités numériques: • Accessibles

    Les BVH: Equipe-projet et CRN « TIPo »

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    • Accessibles • Protégées (propriété intellectuelle) • Réutilisables, partageables, transmissibles • Archivées de façon durable

    • L’organisation d’une communauté: entre incitation et sélection (soumission/ acceptation de projets)

  • Documents patrimoniauxDocuments patrimoniaux

    Documents patrimoniaux Documents

    patrimoniaux

    Imprimés/ manuscrits Imprimés/ manuscrits

    Bibliothèques Région Centre Bibliothèques Région Centre

    Autres (publiques/

    privées)

    Autres (publiques/

    privées)Documents patrimoniaux Documents

    patrimoniaux

    ArchivesArchives

    PubliquesPubliques

    PrivéesPrivées

  • Moteur XTFMoteur XTF

    Métadonnées Catalogue et TEI

    Métadonnées Catalogue et TEI

    PDF, PDF/mrcPDF, PDF/mrc

    SommairesSommaires

    Textes en TEITextes en TEI BVH Bases d’imprimésBVH Bases d’imprimés

    Textes en TEITextes en TEI

    IconographieIconographie

    Mots-clés Iconclass Mots-clés Iconclass

    Lettrines OLDB

    Lettrines OLDB

    Base typographique

    Base typographique

  • Le moteur de recherche XTF (eXtensible Text Framework)

    - Développé par l’Université de Berkeley (California Digital Library) depuis 2005 – Expérimenté pour le site BVH depuis le 22 juillet 2009 - Accessible sur sourceforge.net - Système de recherche multiformat sur les métadonnées et le plein-texte pour les documents

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    documents - Xml, xml/tei - Html - Pdf

    - CrossQuery pour les requêtes, dynaXML pour la restitution selon les feuilles de style XSLT, indexeur Lucene - Opérationnel sur les sites Mark Twain, Newton, The Chicago Encyclopedia… - Permet (avec adaptation):

    - l’alignement fac-similé/ texte - l’application des feuilles de style TEI Renaissance

  • Un modèle possible: Deustches Text Archiv (DTA)

    Affichage de l’image et/ou du texte en html ou en xml

    http://www.deutschestextarchiv.de

    xml

    Liens vers les métadonnées et le téléchargement des fichiers html et xml

  • • CRN émergent Adonis depuis mai 2010: « Textes Imprimés PatrimOniaux » (TIPo)

    • Programme portant sur:

    Un CRN émergent au sein des BVH: TIPo

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    • Les données (imprimés de la Renaissance, actes notariés) et les métadonnées (catalogue, headers TEI) • Les outils • Les savoir-faire (les « compétences ») • Les formations (TEI, gestion de projet)

  • Métadonnées

    Savoir-faire Outils

    Formations

    BVH Données

    Numérisation transcription

    contrôle indexation

    Archivage

  • Modèes de métadonnées

    Savoir-faire

    Outils: développement,

    adaptation, partage

    TIPo Mise à

    disposition des données

    Formations: initiale et continue

  • •Traitement des textes et des images pour les imprimés patrimoniaux

    • Principalement les imprimés anciens (XVe- XVIIe siècles), cœur de cible (extensible aux

    Cibles des BVH

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    XVIIe siècles), cœur de cible (extensible aux ouvrages postérieurs), pôle associé BnF

    • Manuscrits et archives: collaboration avec TELMA et Ecole des Chartes

    • Intégration texte/ image

    • Editions génériques/ génétiques

  • Contenu

    Histoire, littérature, philosophie

    Style

    Communautés de chercheurs et d’usagers

    Langue

    linguistique

    Forme

    Histoire du livre

    Style Histoire de

    l’art

  • •Accès libre et gratuit à toutes les données (y compris la structure TEI – en cours) •Veille juridique et propriété intellectuelle pour:

    Accessibilité et propriété

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    •Les fac-similés numériques, les images extraites •Les textes transcrits et publiés en html et xml •Les textes encodés en TEI •Les métadonnées, les bases de données •Le progiciel co-développé avec une société (Edit-tei) •Les applications en licence libre (AGORA, avec le LI de Tours) = libres de droits, avec licence CC (sauf Edit-tei)

  • Header affiché

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

  • Données

    SVN Copie 1 Copie 2

    Archivage local/ délocalisé

    SVN Externalisé Pdf, textes

    Copie 1 JPG

    bibliothèque

    Copie 2 JPG

    CESR

    Copie 3 JPG Cines?

    IN2P3?

  • • Un logiciel d’analyse de structuration de la page, AGORA (opérationnel), avec le Laboratoire d’Informatique de Tours (J.-Y. Ramel)

    • Un logiciel d’OCR (RETRO) pour la typographie ancienne

    BVH: outils pour l’image patrimoniale

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    • Un logiciel d’OCR (RETRO) pour la typographie ancienne (en développement), avec le Laboratoire d’Informatique de Tours (J.-Y. Ramel) et le LITIS (Rouen)

    • Un comparateur et un indexeur de lettrines (fond, lettre, motif) dans la base OLDB, avec le Laboratoire d’Informatique de Tours (J.-Y. Ramel) et le consortium Navidomass (J.-M. Ogier, U. de La Rochelle) – en développement

  • Les Bibliothèques Virtuelles Humanistes http://www.bvh.univ-tours.fr/

    AGORAAGORA • Extraction automatique des éléments figurés du livre

    • Préindexation automatique des types d’éléments et pré-balisage

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    • SOUS-BASES D’IMAGES

    • Galerie des marques typographiques

    • Galerie de portraits

    • Base emblèmes (indexée par Iconclass)

    • Base lettrines (indexation propre + Iconclass)

  • EXTRACTION GRAPHIQUE: SCENARIOS

    • Délimitation des zones de texte/ image selon des scénarios

    • Scénarios: type de zone d’image/ de texte (lettrine, titre, signature, réclame, corps de texte, numéro de page, titre courant, marges bruit, …)

  • CLASSIFICATION PAR PROXIMITÉ

  • Structure physique: les blocs

    Eléments

    graphiques

    pictura/ illustration

    graphiques

    Bloc de texte

    Lettre

    ornée

    Portrait

    Ornement

    Marque

    D’imprimeur

  • Les Bibliothèques Virtuelles Humanistes http://www.bvh.univ-tours.fr/

    ICONCLASS: MOTS-CLÉS POUR INDEXER LES IMAGES

    ET LE TEXTE

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    http://www.bvh.univ-tours.fr/Iconclass_browse.asp

  • Les Bibliothèques Virtuelles Humanistes http://www.bvh.univ-tours.fr/

    Indexation des emblèmes

    •Base d’emblèmes (Iconclass)

    • Collaboration avec le projet French Emblem Books (Glasgow)

    • Indexation avec codification alpha-numérique

    Centre d'Études Supérieures de la Renaissance Université François Rabelais, Tours - UMR 6576 du CNRS – MSH de Tours http://www.cesr.univ-tours.fr/

    • Indexation avec codification alpha-numérique

    • Entrepôt OAI Iconclass moissonné

    • Encapsulation web du thésaurus multilingue

    • Affichage multilingue des données d’indexation

  • Les Bibliothèques Virtuelles Humanistes http://www.bvh.univ-tours.fr/

    Extraction des éléments graphiques: portraits http://www.bvh.ques niv-tours.fr/img_portrait.asp

    Centre d'Études Supérieures de la Renaissa