Les sections Funding ou Acknowledgment font partie des éléments qui structurent la présentation d’une recherche dans une publication scientifique : elles donnent des indications aux lecteurs sur le financement de la recherche tout comme elles permettent un suivi pour les financeurs. On y trouve le nom de l’organisme financeur, un nom ou un n° de projet. Ces informations codifiées peuvent être traitées de façon automatique par des algorithmes et c’est ce que HAL met en oeuvre depuis le 5 mars pour les projets financés par l’Agence Nationale de la Recherche (ANR).
Objectif : simplifier le dépôt …
Pour ajouter automatiquement un projet ANR dans le formulaire, la première étape est d’extraire l’information à partir du fichier pdf déposé. L’application qui extrait déjà les auteurs, titres, résumés, titres des revues, etc. s’est enrichie des métadonnées de financement.
HAL traite ensuite ce qui est récupéré en vérifiant sa correspondance dans les données de référence auréHAL. Si une correspondance est trouvée, le formulaire est complété. Le déposant est néanmoins invité à vérifier ce qui est proposé, tout comme pour les autres métadonnées extraites automatiquement.
… avec des métadonnées fiables et de qualité
Les métadonnées proposées sont cependant consolidées.
D’une part, les informations extraites sont contrôlées à l’aide du référentiel des financeurs gérés par CrossRef (Open Funder Registry) et qui attribue des DOIs à ces organismes.
D’autre part, les données de référence auréHAL pour les projets ANR sont issues des jeux de données déposés par l’agence sur la plateforme nationale data.gouv.fr.
En utilisant cette source officielle de données, HAL offre ainsi la garantie de données fiables et de qualité. Le dépôt est de ce fait bien référencé dans le portail HAL de l’ANR dont l’objectif est de faciliter l’accès à l’ensemble des publications scientifiques issues des projets financés par l’agence.
Cette évolution de HAL s’inscrit dans le cadre du projet Equipex+ HALiance, et plus précisément dans le work package 3 qui a pour objectifs de récupérer des métadonnées et des identifiants dans les fichiers déposés et d’enrichir automatiquement la base HAL. Le CCSD s’appuie sur une collaboration avec la société Science-Miner qui développe des outils open source d’exploration de textes scientifiques. La prochaine étape pour HAL est d’élargir le service aux projets européens.