Valoriser le lien entre votre dépôt HAL et un jeu de données ou un logiciel : une nouveauté pour booster la visibilité de vos recherches

Écrit par Agnès Magron

Le formulaire de dépôt HAL évolue pour mieux gérer les liens entre votre publication et d’autres ressources, comme un jeu de données, un code source archivé sur Software Heritage ou un autre dépôt HAL. Désormais, un seul champ regroupe tous les types d’identifiants (DOI, HAL, SWHID), avec une vérification instantanée pour plus de fiabilité. La relation entre les ressources est précisée grâce à un vocabulaire standard.  Le petit plus ?  Si la ressource est dans un entrepôt partenaire (Nakala et recherche.data.gouv), ses informations, voire la ressource elle-même, seront visibles dans votre dépôt HAL, facilitant leur découverte.

Un des objectifs du projet HALiance est d’améliorer la mise en relation des publications et  des données associées, en rendant ce processus plus fluide grâce notamment à des mécanismes automatisés.

Le formulaire de dépôt HAL s’adapte ainsi à une refonte globale du système de relations entre les ressources. Elle vise à harmoniser le traitement des relations, que ce soit en interne (pour associer plusieurs dépôts HAL entre eux) comme externes (dépôts HAL liés à une ressource disponible sur Nakala, recherche.data.gouv, Software Heritage et tout autre entrepôt dédié aux données de recherche).

En pratique

La section du formulaire de dépôt nommée Ressources associées permet ainsi d’ajouter une ou des relations entre votre dépôt et un jeu de données ou un code source. Une seule condition indispensable : la ressource associée doit être dotée d’un identifiant (DOI, SWHID ou HAL). La validité de l’identifiant est contrôlée instantanément, cela offre ainsi la garantie que les informations seront exploitables.

page écran, extrait du formulaire de dépôt dans la section "Ressources associées" : 4 métadonnées peuvent être complétées (Relation, Entrepôts, Identifiant, Commentaire)

Si vous souhaitez associer une ressource qui est présente dans HAL, Nakala ou recherche.data.gouv, la saisie est facilitée : vous pouvez la rechercher en entrant un nom d’auteur, un titre, etc. Il vous suffira ensuite de sélectionner parmi les choix qui vous sont proposés.

page écran, extrait du formulaire de dépôts, section Ressources associées : démonstration qu'en sélectionnant l'entrepôt Nakala, la recherche par titre permet de sélectionner parmi une liste de ressources

Vous disposez aussi d’une typologie de relations qui permet de préciser ce qui relie votre dépôt à cette autre ressource. La liste proposée s’appuie sur un vocabulaire standardisé produit par Datacite et largement utilisé à l’international. Vous trouverez dans la documentation utilisateurs de HAL un descriptif de la typologie des relations, avec des cas d’usage pour vous guider.  Par exemple, dans le cas d’une publication liée à une image archivée sur Nakala, on utilisera la relation “Cite”.

Booster la visibilité et l’impact des données de recherche

Les chercheurs et chercheuses  sont fortement encouragé.es à déposer leurs publications dans des archives ouvertes et à rendre leurs données accessibles dans des entrepôts dédiés. Améliorer le dialogue entre HAL et les entrepôts de données s’avère indispensable. Cela contribue à  assurer la transparence, la reproductibilité et la validation des résultats de recherche.

Cela favorise également le partage et la réutilisation des données par la communauté scientifique, augmentant ainsi l’impact de la publication.

Le partenariat avec les entrepôts Nakala et recherche.data.gouv permet notamment à toute personne consultant votre dépôt HAL de visualiser  les métadonnées des jeux de données que vous aurez associés à votre publication, voire d’afficher la ressource comme dans l’exemple ci-dessous.

page écran d'un dépôt HAL avec une image archivée sur Nakala : l'image est affichée sur le dépôt HAL

Pour que l’information soit exploitable par les machines, agrégateurs de contenus comme moteurs de recherche, le format TEI du dépôt contient également les informations structurées. Celles-ci incluent  le type de la ressource (image, jeu de données, logiciel, etc) qui s’appuie sur une typologie standard internationale. Les API sont enrichies de trois nouveaux champs : relatedData_s, relatedSoftwares_s  et relatedPublication_s).

Traitement de l’existant et perspectives

Avant la mise en production, on recensait 32 037 dépôts avec des relations : 80% de ces relations associent des dépôts HAL entre eux. 925 relations concernent des données entreposées dans Recherche.data.gouv et 180 des données de Nakala. Quant aux relations d’un dépôt avec un code archivé sur Software Heritage, on en dénombre 333.

L’évolution vers le nouveau système de relations nécessite un traitement de cet existant afin de migrer les données. L’opération impose un inévitable nettoyage des données, la saisie des identifiants n’était auparavant pas contrôlée. Tous les dépôts ont été réindexés après la mise en production.

Une prochaine étape vise à mettre en place le mécanisme qui permettra d’échanger les relations avec les entrepôts concernés (via le protocole COAR Notify)afin qu’ils puissent récupérer la relation avec HAL.

2 comments

  1. Florent Bédécarrats

    Bonjour, j’ai justement très récemment déposé une prépublication sur HAL, à laquelle je voulais lier un dépôt Github, mais je n’ai pas trouvé comment faire. Est-ce que c’est possible, via l’URL ou l’identifiant de l’utilisateur ou organisation + dépôt ?
    Peut-on rajouter des relations après la première publication (par exemple lorsqu’on dépose une nouvelle version du preprint ?
    Merci d’avance pour vos réponses.

    1. Agnès Magron

      Bonjour,
      La fonctionnalité qu permet de lier un dépôt ne prend en charge que les ressources avec un identifiant DOI ou SWHID. Avez-vous vérifié si votre dépôt Github est présent dans Software Heritage ?
      Pour l’ajout de relations, vous pouvez le faire à tout moment : au moment du dépôt, à l’ajout d’une version ou en modifiant votre dépôt déjà en ligne. (voir aussi la documentation).
      Cordialement,

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.