Accord national avec l’éditeur Elsevier : mise en oeuvre des imports dans HAL

Actualités
HAL

Écrit par Agnès Magron

Prévu dans l’accord de licence nationale avec Elsevier,  un premier lot de fichiers fournis par l’éditeur sera importé prochainement dans HAL pour compléter des notices existantes. Le volet “green OA” de l’accord stipule qu’Elsevier fournit la version Manuscrit Auteur Accepté (MAA) des articles des auteurs affiliés aux institutions de l’ESR français s’ils sont répertoriés comme auteur correspondant. HAL pourra les diffuser librement mais seulement 24 mois après la date de publication.

Le calendrier de mise en oeuvre par le CCSD se décline en deux étapes :

  • Étape 1 en octobre 2021 : ajout des fichiers MAA aux notices existantes. Cela représente un volume d’environ 3400 articles publiés entre le 1er janvier 2019 et le 30 septembre 2019
  • Étape 2 en décembre 2021 :
    • ajout de publications non présentes dans HAL (import des métadonnées et des fichiers MAA) publiées entre le 1er janvier 2019 et le 1er octobre 2019. Le volume est estimé à 3532 articles.
    •  ajout de 4412 notices d’articles publiés entre le 1er octobre 2019 et le 30 septembre 2020. Les métadonnées contiendront le lien MAA sur le site d’Elsevier. Une fonctionnalité d’opt-out sera mise en place qui permettra à l’auteur de correspondance de refuser le lien vers la plateforme d’Elsevier.
L’accord Couperin-Elsevier

L’objectif est de référencer dans HAL tous les articles des auteurs affiliés à une institution de l’ESR parus dans une revue incluse dans l’accord national avec l’éditeur Elsevier (2019-2022). Le contrat prévoit la fourniture :

  • des métadonnées des articles publiés dans les revues d’Elsevier incluses dans le marché et ayant au moins un auteur affilié à une institution française. Ces métadonnées sont utilisées pour assurer un bon référencement de la production scientifique française dans les outils utilisés par les institutions de l’ESRI et d’une façon générale pour assurer une visibilité mondiale renforcée de ces travaux
  •  l’url d’accès sur une plateforme de l’éditeur au manuscrit auteur accepté (MAA ou version finale avant publication) des articles dont l’auteur correspondant (corresponding author) est affilié à une institution française. Le lien est affiché sur le dépôt HAL 12 mois après la date de publication : « Elsevier-hosted Accepted Manuscript » (sauf si le fichier contenant le texte intégral a été ajouté par un utilisateur)
  • les fichiers MAA des articles dont l’auteur correspondant est affilié à une institution française. Ces fichiers sont exposés et librement accessibles sur HAL 24 mois après la date de publication.

Cette fourniture contractuelle ne contredit en rien la liberté pour le chercheur d’auto-archiver le texte intégral de ses publications comme il est mentionné explicitement dans l’accord : Les auteurs peuvent déposer en auto-archivage leur MAA dans les archives ouvertes, en application et dans le respect de la Loi pour une République numérique.

Les traitements réalisés dans HAL

Côté CCSD, un workflow a été élaboré et des développements ont dû être réalisés pour traiter les données.

En premier lieu, un contrôle à partir de l’identifiant DOI et le titre de l’article permet d’éviter l’import de doublons : si un dépôt avec fichier existe déjà dans HAL, la notice Elsevier n’est pas traitée,  et s’il y a déjà un dépôt sans fichier, il est mis à jour avec un identifiant Elsevier et l’url d’accès au MAA. Cet url d’accès permettra la récupération du fichier pour qu’il soit disponible sur HAL 24 mois après la date de publication.

En octobre, sur les 25158 articles fournis jusqu’à présent, 30% sont déjà présents dans HAL avec le texte intégral, 30% sont référencés dans HAL par une notice et 39% ne sont pas connus de HAL.

Workflow d’intégration

Les métadonnées fournies ne contiennent pas la métadonnée « discipline » qui est obligatoire pour HAL : celle-ci est ajoutée automatiquement au dépôt importé en croisant l’issn de la revue et les disciplines choisies dans les dépôts HAL associés à cette revue. Les affiliations fournies par Elsevier sont alignées avec les structures de recherche du référentiel de HAL : on ne complète le dépôt que si l’affiliation trouvée existe au statut valide ou fermé dans AURéHAL. Dans les autres cas, le dépôt n’est pas complété avec l’affiliation.

Si un ORCID présent dans les données fournies par Elsevier correspond à un utilisateur de HAL, celui-ci aura la propriété du dépôt. Aussi, ne soyez pas étonné de recevoir des notifications si vous êtes dans ce cas.

Enfin, les fichiers importés lors de la première étape seront mis en ligne sans être modérés, sauf si le test comparant le titre mentionné dans le fichier et celui de la notice existante n’est pas satisfaisant.

Ces imports issus d’une fourniture contractuelle viennent ainsi compléter le référencement de la production des chercheurs dans HAL et enrichiront CV, collections et portails.  D’autres livraisons suivront puisque l’accord couvre la période 2019-2022.