Bientôt 323 000 nouveaux dépôts dans HAL

Écrit par CCSD

 Non, ce n’est pas un effet du confinement pendant lequel beaucoup en profitent pour déposer leurs publications dans HAL – quoique vous êtes tous très actifs en ce moment – mais l’effet de la migration des archives institutionnelles ProdINRA et Irstea Publications. 

Un précédent billet annonçait l’ouverture du portail HAL INRAE destiné à les remplacer. Les préparatifs pour la migration des données de ces deux bases sont terminés : en volume cela représente 285 000 documents de Prodinra et près de 38 000 d’Irstea Publications, dépôts avec fichier mais une proportion plus importante de références bibliographiques. La durée de traitement est estimée à plusieurs jours.

Le 14 mai débutera la migration de Irstea Publications suivie, à partir du 25 mai, de celle de Prodinra. 

Cette migration est la dernière étape d’un long travail qui s’est déroulé sur environ 2 ans, tant du côté du CCSD que de celui des équipes des deux instituts qui ont fusionné l’année dernière.

Alignement des données des référentiels auteurs et structures

Afin de limiter la création de doublons dans AuréHAL, un travail préparatoire d’alignement des données concernant les auteurs et les affiliations a été réalisé, le plus gros chantier portant sur les structures de recherche. 

Curation par les équipes des instituts 

  •  Inra : curation des données notamment les affiliations françaises, allemandes et espagnoles ;  réalisation et affinage d’un algorithme d’alignement des structures ProdInra / AureHAL pour les affiliations externes (niveau Institution). Cela a permis de trouver des correspondances sur environ 12 000 structures.
  • Irstea : reconstitution de l’historique des structures Irstea ; algorithme d’alignement des structures Irstea / AureHAL ; réalisation et affinage d’un algorithme d’alignement des structures Irstea Publications / AureHAL pour les affiliations externes (niveau Institution essentiellement). Cela a permis de trouver des correspondances sur environ 8 000 structures.

Grâce au club utilisateurs CasuHAL,  le CCSD a ensuite sollicité les administrateurs de portails HAL et les référents de laboratoires. 42 personnes ont fait des retours, ce qui a permis d’aligner et corriger 2317 affiliations, de niveau laboratoire ou équipe de recherche. 

Les dépôts

Pour les publications existant déjà dans HAL, voici les règles qui sont implémentées pour l’import :

  • Les données d’un dépôt existant ne sont pas modifiées,
  • un dépôt peut être complété avec une métadonnée renseignée par l’import, un DOI par exemple,
  • un dépôt peut être complété avec un fichier.     

Si vous constatez un nombre important de doublons, merci de nous le signaler en écrivant à hal.support@ccsd.cnrs.fr.