Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB
-
Upload
ulb-bibliotheques -
Category
Education
-
view
552 -
download
2
Transcript of Carrefour de l’IST – Nancy 2014 : Témoignage de l’ULB
L’Université libre de Bruxelles a fêté ce8e année ses 180 ans. Elle est située sur différents campus et sites à Bruxelles mais également en Wallonie ; ce qui peut avoir un impact sur l’adresse insFtuFonnelle employée par les chercheurs.
Lors de sa créaFon, l’ULB rassemblait à la fois les étudiants francophones et néerlandophones. Mais dans les années 60, la Belgique connut une crise linguisFque importante qui mena à la scission de l’université et à la créaFon de la Vrije Universiteit Brussels (VUB) néerlandophone. Il arrive fréquemment que des chercheurs traduisent leur adresse insFtuFonnelle par « Free universi2es of Brussels » rendant quasiment impossible la disFncFon entre les publicaFons de la VUB et de l’ULB.
2
Le dépôt insFtuFonnel de l’ULB, appelé DI-‐fusion, a été mis en place en septembre 2009. Ses missions sont les suivantes :
• Me8re en valeur la producFon scienFfique de l'Université ;
• Augmenter la visibilité, l'accessibilité et l'impact de la recherche effectuée à l'ULB ;
• Assurer le référencement des publicaFons et travaux scienFfiques de l'ULB à fins d'évaluaFon, de classement, etc ;
• Assurer l'archivage des publicaFons et travaux scienFfiques de l'Université.
3
Quelle est la plus-‐value de l’encodage dans DI-‐fusion pour le chercheur ?
è Il peut générer très rapidement une liste de publicaFons complète en format PDF.
N.B. : Les chercheurs de l’ULB sont fortement encouragés à encoder dans le dépôt mais rien ne les y oblige véritablement sauf s’ils désirent postuler à un autre posiFon à l’ULB ou demander une bourse de recherche au Fonds NaFonal de la Recherche ScienFfique. Dans ce cas, pour que leur candidature soit prise en compte, leur liste de publicaFons doit être Frée de DI-‐fusion.
4
Autre exemple de plus-‐value pour les chercheurs :
è l’alimentaFon automaFque de leur page personnelle sur le site de l’université. Un clic sur « Voir toutes les publica2ons » mène vers la liste complète des publicaFons du chercheur en quesFon dans DI-‐fusion.
5
DI-‐fusion, qui s’appuie sur plusieurs logiciels libres comme VuFind et Dspace, compte 138.700 références dont 16% disposent du texte complet. Les noFces bibliographiques sont accessibles à tout internaute. Des restricFons d’accès sont placées au niveau des textes complets déposés par les chercheurs. Les textes complets peuvent être en accès libre (7%), en accès restreint à la communauté universitaire ou en accès privé.
Un peFt personnage à la droite d’un nom d’auteur signifie que ce8e personne est (ou a été) un membre de l’ULB. Un clic sur ce personnage permet de générer la liste des publicaFons de ce chercheur au format PDF, par exemple.
6
L’interface d’encodage n’est accessible qu’aux membres de l’ULB. 32 types de documents différents peuvent être encodés. L’encodage s’effectue soit manuellement, soit à l’aide de foncFonnalités d’import semi-‐automaFque. Dans ce8e présentaFon, nous nous concentrerons sur l’import à parFr de Scopus.
7
L’import des références ne s’effectue pas directement entre Scopus et DI-‐fusion mais passe par un réservoir intermédiaire. Dans un premier temps, nous nous intéresserons sur l’alimentaFon de ce dernier (flèche rouge).
Le réservoir intermédiaire compte 54.425 références. Il a été alimenté pour la première fois en 2010 à l’aide de plusieurs DVDs fournis par Elsevier. Depuis, un script mensuel y ajoute les nouvelles références indexées par Scopus le mois précédent. Les références importées dans ce réservoir conFennent au moins une des 43 affiliaFons principales correspondant à l’ULB.
8
Voici une parFe des 43 affiliaFons principales correspondant à l’ULB et idenFfiées dans Scopus. Comme on peut le voir, il existe des doublons (même inFtulé, AF-‐ID différent) qui nécessiterait un ne8oyage (certainement une fusion). Le « Free universi2es of Brussels » est également présent bien qu’il ramène avec lui des publicaFons de la VUB. Pour ce dernier, un ne8oyage manuel, noFce par noFce, devra certainement être effectué afin d’idenFfier les publicaFons de l’ULB.
Parmi ces 43 affiliaFons, se trouvent également celles des hôpitaux associés pour lesquels la présence de doublons est également observable.
9
La liste des 43 affiliaFons principales étant relaFvement incomplète, nous avons procédé il y a quelques mois à des analyses complémentaires afin d’idenFfier d’autres affiliaFons. Pour ce faire, nous avons lancé des requêtes sur des termes ou expressions suscepFbles de se trouver dans l’adresse insFtuFonnelle uFlisée par un chercheur de l’ULB, mais étant suffisamment discriminant(e)s. Nous avons bien sûr écarté les publicaFons où apparaissait une des affiliaFons précédemment idenFfiées. À chaque fois qu’une nouvelle affiliaFon correspondant à l’ULB était trouvée, son AF-‐ID était ajouté à la liste des AND NOT dans les requêtes ultérieures.
Ces recherches nous fournissent une liste de publicaFons dont les noFces sont présentées de la manière suivante. À parFr de ce8e interface, il est impossible d’idenFfier l’inFtulé et l’AF-‐ID qui se cachent derrière « b Ecole de Santé Publique, … » dans l’exemple proposé.
10
Pour idenFfier le nom des affiliaFons (ici, « Ecole de Santé Publique ») et leur AF-‐ID (ici, encadré en rouge), nous avons exploité une des APIs fournies par Elsevier. Celle uFlisée ici permet de visualiser le code XML d’une noFce à parFr du numéro d’idenFfiant de la publicaFon (eid).
11
Nous nous intéressons à présent à l’import de références contenues dans le réservoir vers DI-‐fusion (flèche rouge). Sur les 54.425 références du réservoir, environ 21.000 ont été importées dans DI-‐fusion.
12
Deux types d’import sont possibles : 1. l’import semi-‐manuel effectué par le chercheur lorsqu’il clique sur « Importer de Scopus » sur l’écran d’encodage. Il arrive alors sur cet écran où il introduit le nom de l’auteur souhaité. Le système lui indique les résultats en précisant le nombre de publicaFons présentes dans le réservoir qui y correspondent. En cliquant sur le nom d’un auteur, les noFces des publicaFons qui lui sont associées apparaissent (illustraFon de droite). Avant leur validaFon, le chercheur peut procéder à des modificaFons. 2. l’import automaFsé n’est possible que pour les références dont tous les auteurs ont déjà été validés ou peuvent l’être automaFquement. Parmi celles-‐ci, sont suspendues les références dont le type de document menFonné dans Scopus ne correspond à aucun type de document disponible dans DI-‐fusion. L’import automaFsé a tourné le 16 juin 2014 et a permis d’importer environ 7.000 références. Très prochainement, cet import sera effectué de manière régulière.
13
La gesFon des auteurs est primordiale pour effectuer des imports automaFsés. Dans Scopus, une forme d’un auteur correspond à un ScopusID. Il arrive relaFvement souvent qu’un auteur dans la vraie vie soit associé à de mulFples ScopusID. C’est le cas de ce chercheur de l’ULB. Afin d’améliorer sa représentaFvité dans le système, il serait opportun que ce chercheur procède à la fusion des ScopusID qui lui correspondent. Une demande de fusion peut être aisément adressée à Scopus en sélecFonnant les profils concernés et en cliquant sur « Request to merge authors ». Nous esFmons que ce « ne8oyage » devrait être effectué par le chercheur lui-‐même ; lui seul étant capable de déterminer avec cerFtude si un profil lui correspond ou non.
14
Il arrive également fréquemment qu’un ScopusID d’auteur soit lié à un main auteur (dont la noFce comprend généralement un prénom complet). Dans ce cas, la fusion d’auteurs avec le main auteur est fréquente.
C’est le cas de l’exemple proposé, preuves étant que : • Une recherche à Ruyschaert J-‐M ne ramène que cet unique résultat ;
• La noFce renseigne un nombre important de variantes du nom (à droite).
15
Dans DI-‐fusion, nous essayons au maximum qu’un auteur dans la vraie vie corresponde à un auteur dans DI-‐fusion associé à un seul idenFfiant (tableau de droite).
L’import d’une référence de Scopus implique que la table de mapping conFenne l’authorID de Scopus associé à un authorID ULB. S’il n’y a pas de correspondance, une validaFon automaFque des auteurs est possible si un certain nombre de règles est respecté, comme par exemple : si le ScopusID n’a pas encore été validé, et l’affiliaFon de l’auteur est l’une des 43 et il n’existe qu’un auteur ULB dans DI-‐fusion de même nom et iniFale du prénom, alors le mapping de cet auteur est automaFquement effectué.
Il existe également une sorte de fichier « an2-‐mapping » avec les auteurs dont nous sommes sûrs qu’ils n’apparFennent pas ou n’ont pas appartenu à l’ULB. Et lors de l’import, ce8e liste est également consultée.
16
Comme indiqué dans la règle de validaFon, nous nous basions au départ sur le nom et l’iniFale du prénom, le plus souvent renseignés dans l’XML des références importées, mais nous nous sommes rendu compte que nous avions mappé des personnes différentes (même inFale mais prénom différent). Pour améliorer le mapping et éviter ce genre d’erreurs, nous uFlisons à présent le REST API lorsque les prénoms des auteurs dans l’XML des publicaFons ne comprennent qu’une iniFale. Ce8e API permet, à parFr du authorID, de consulter la noFce complète de l’auteur et de connaître son prénom complet.
17
Nous envisageons de travailler très prochainement : • À la réa8ribuFon d’AF-‐ID à des auteurs qui n’en ont pas ou pour lesquels celui
menFonné est erroné. Ce8e réa8ribuFon s’effectue noFce par noFce et les demandes de correcFons sont adressées à Elsevier via un formulaire en ligne ;
• Au ne8oyage des profils d’affiliaFon (via la fusion d’AF-‐ID) ;
• Au ne8oyage des profils d’auteur (par demande de fusion, comme précédemment illustré) même si nous esFmons que ce travail serait plus précis s’il était effectué par le chercheur lui-‐même ;
• À l’amélioraFon du mapping des types de documents afin de diminuer le nombre de noFces suspendues ;
• À la pré-‐validaFon manuelle des auteurs ;
• À l’import direct de Scopus dans DI-‐fusion via notre résolveur de lien (cf. dia suivante).
18
Le réservoir étant relaFvement incomplet (en effet, il ne conFent pas toutes les publicaFons de l’ULB, ni celles publiées par un auteur ULB avant qu’il ne soit membre de l’université*), nous avons développé un import direct à parFr de Scopus noFce par noFce qui sera très prochainement opéraFonnel (encadré rouge).
*Ces publicaFons doivent également être dans le dépôt insFtuFonnel afin de pouvoir générer la liste complète des publicaFons d’un chercheur.
19