Collecter vos publications en libre accès pour les importer dans HAL : bientôt un nouveau service

Écrit par CCSD

Certaines de vos publications sont déjà en libre accès sur le site de l’éditeur et vous souhaitez les déposer ? Et si HAL les collectait pour vous ? Ce sera bientôt possible avec un nouveau service prévu pour fin 2023 qui proposera aux chercheur·es une fonctionnalité de suggestions de dépôt permettant d’importer automatiquement leurs publications identifiées avec un DOI et diffusées sous licence Creative Commons.

Alimenter automatiquement HAL en collectant des publications qui sont déjà en libre accès est une nouvelle étape vers la simplification du dépôt.  C’est une des mesures inscrites dans le deuxième Plan National pour la science ouverte pour faciliter l’appropriation de la plateforme par les chercheur.es, et leur permettre ainsi de se conformer aux incitations ou obligations de dépôt, qu’elles émanent  de leur institution de rattachement ou des agences qui financent leurs recherches.

Le développement et le déploiement d’un tel service constitue notamment un axe majeur du projet Equipex+ HALiance (work package 6).

Ce service de collecte automatique de publications est actuellement en phase finale de développement. Le chef de projet, Yannick Barborini, l’a présenté  lors d’un webinaire consacré à la présentation à mi-parcours du plan d’action 2023 du CCSD le 10 juillet dernier. Pour voir ou revoir la présentation et la démonstration, c’est sur Canal U ou bien ci-dessous :

Le principe de ce nouveau service proposé aux chercheur·es est de leur suggérer des publications à importer dans HAL. Il s’agit en effet, à partir du DOI, de repérer leurs publications qui sont déjà en libre accès sur d’autres plateformes pour les proposer dans une interface : si l’utilisateur valide la suggestion, le dépôt est importé automatiquement sans aucune autre intervention de sa part.

La fonctionnalité concerne aussi bien l’ajout du fichier à une notice existant déjà dans HAL (on ne touche pas aux métadonnées) que la création du dépôt si la publication n’est pas déjà référencée.

La fonctionnalité comprend deux sections :

  • un écran qui  présente la liste des suggestions et à partir de laquelle plusieurs actions sont possibles : voir le fichier qui sera importé, l’importer dans HAL,  signaler que ce n’est pas le bon fichier ou bien supprimer la suggestion ;
  • un écran qui permet de configurer le service et affiner les critères de recherche, par ex en utilisant l’identifiant ORCID (utile en cas d’homonymies). Cet écran permet également de choisir d’être averti de toute nouvelle suggestion.

Comment sont produites les suggestions

HAL s’appuie sur une base de données réalisée par l’Inist, mise à jour une fois par mois.

L’identification de la production scientifique française est réalisée dans un premier temps grâce à l’agrégateur de données OpenAlex. On récupère ensuite les métadonnées bibliographiques de la production identifiée à partir de plusieurs sources (CrossRef, HAL et Pubmed) afin de constituer une base de notices unifiées.

Les métadonnées sont ensuite enrichies en ajoutant une discipline HAL et, dans la mesure du possible, l’identifiant RNSR pour les affiliations des auteurs. Puis, un alignement est réalisé avec les données Unpaywall pour déterminer le fichier qui pourra être déposé dans HAL.

On vérifie ensuite l’état  dans HAL : la publication est absente ou bien elle est déjà référencée comme notice.

Pour être proposée dans la liste des Suggestions, la publication doit cependant remplir au moins deux conditions :

  1. le fichier n’est pas sous embargo sur la plateforme source,
  2. et une licence Creative Commons doit être présente dans les métadonnées : c’est elle qui garantit que HAL peut diffuser le fichier en toute légalité.

L’analyse quantitative de la base actuelle permet d’estimer à environ 72 000 imports potentiels couvrant la période 2014-2023 : 5 000 nouvelles publications et 67 000 ajouts de fichiers à des notices* . Ce sont principalement des articles publiés et des chapitres d’ouvrages, couvrant toutes les disciplines scientifiques.

La fonctionnalité est en cours de développement. Une phase d’entretiens avec des chercheur·es. a permis d’affiner et d’améliorer les écrans.  Après intégration des remarques utilisateurs dans les interfaces viendra une phase de test. La mise à disposition de ce service est prévue pour la fin 2023.

Il fera l’objet d’une communication à Open Science FAIR le 26 septembre prochain, présentée par Yannick Barborini.

*à noter que ces chiffres datent du 12 septembre et sont légèrement différents de ceux annoncés lors du webinaire, la méthode de calcul ayant  été affinée.

7 comments

  1. GABA

    Madame, Monsieur,
    J’aimerais savoir précisément si cette fonction ou possibilité est valable pour les articles publiés dans des revues juridiques avant la loi pour une république numérique de 2016.
    Merci d’avance.
    Bien cordialement,
    Harold Kobina GABA

    1. Agnès Magron

      Bonjour,
      Cette fonctionnalité permet de récupérer automatiquement ce qui est déjà en libre accès ailleurs (site de l’éditeur, archive ouverte). Avez-vous des publications qui sont dans ce cas ? Sont-elles diffusées avec une licence Creative Commons ? Si oui, il faut qu’elles puissent être repérées automatiquement et, pour cela, HAL utilise l’identifiant DOI. Les éditeurs français en droit et sciences juridiques utilisent assez peu cet identifiant il me semble (à vérifier bien sûr). A titre indicatif, une première estimation dans la base des suggestions donne le chiffre de 189 publications avec la discipline Droit.
      Cordialement.

  2. CAPLAN Raul

    Excellente initiative. J’espère que la mise en place sera rapide et simple.

  3. Elisa Espinosa

    Bonjour,

    Je vois dans la démonstration que les publications retrouvées par le système seront proposées à l’ajout aux co-autrices et co-auteurs également.
    Quid de l’accord nécessaire de tous les co-autrices et co-auteurs, actuellement nécessaire (du moins en théorie) pour l’ajout des textes intégraux ?
    Merci par avance !

    1. Agnès Magron

      Bonjour,
      Cette fonctionnalité ne change en rien les règles actuelles pour le dépôt. Cependant, dans la mesure où la publication suggérée est déjà sous licence Creative Commons, les auteurs/autrices se sont déjà accordés sur les conditions de la diffusion.
      Cordialement.

  4. Françoise Pinsard

    Bonjour
    Excellente nouvelle !
    Une remarque sur la période 2014-2023 : des auteurs sont partis et les demandes de validation risquent de tomber dans la trappe. Un mécanisme de détection de non-réponse est-il prévu ?
    Cordialement

    1. Agnès Magron

      Bonjour et merci pour votre retour enthousiaste !
      La collecte ciblée est une nouvelle voie de dépôt pour les chercheur.es, afin de leur faciliter la pratique de HAL et de simplifier la récupération des publications qui sont déjà en libre accès ailleurs. Les notions de demande de validation en attente ou de non-réponse n’existent pas. Une publication non traitée reste dans la base des suggestions, c’est tout.
      il me semble que votre question se situe plutôt au niveau du laboratoire/d’une équipe et de la gestion des publications qui y sont rattachées. Nous envisageons la possibilité qu’un utilisateur puisse agir pour le compte de l’auteur, mais pour l’instant, cela n’est pas mis en place.
      Cordialement

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.