Les identifiants persistants (PIDs) et leurs métadonnées associées sont des éléments essentiels des infrastructures de recherche ouvertes. Vous connaissez le DOI, l’ORCID, on vous parle régulièrement du ROR : ils permettent l’identification fiable, unique et à long terme des personnes, des institutions et des ressources dans l’écosystème de recherche, ainsi que les liens entre eux. Ils prennent en charge et facilitent la découverte, l’attribution et la reconnaissance, l’évaluation, l’interopérabilité, etc.
La conférence PIDfest, qui s’est déroulée en juin dernier à Prague, a rassemblé de nombreux représentants, utilisateurs et décideurs au niveau international pour discuter des défis liés aux infrastructures de support et de diffusion de la production scientifique, ainsi que du rôle des identifiants pérennes pour assurer l’accessibilité, l’interopérabilité et la réutilisabilité des données scientifiques, conformément aux principes FAIR (Findable, Accessible, Interoperable, Reusable).
Le CCSD était présent aussi : participer à cette conférence internationale a été l’opportunité de présenter l’usage des identifiants dans HAL au cours d’une session dans laquelle étaient présentés différents cas d’usage.
Pourquoi utiliser des identifiants persistants est-il important ?
Pour prendre l’exemple de HAL, ceux-ci permettent :
- de simplifier l’auto-archivage : à l’aide du DOI ou du PMID (identifiant PubMed) par exemple, les métadonnées associées sont récupérées pour compléter le formulaire de dépôt ;
- d’éviter les doublons et préserver la qualité et la fiabilité des données ;
- de rendre les entités, comme les affiliations, détectables, et soutenir ainsi le processus de curation ;
- de créer des outils pour le suivi des résultats de la recherche ;
- de suivre les modifications et enrichir les métadonnées ;
- d’aider les modérateurs lors de la vérification de la conformité des dépôts.
Un fois le dépôt enregistré, plusieurs connexions sont établies entre les différentes entités numériques et le dépôt, de nouvelles entités peuvent être créées dans le cas où elles sont inexistantes dans HAL. Ces entités (structures, auteurs, revues..) peuvent être consultées, vérifiées et validées dans auréHAL par les spécialistes de l’information comme les personnels en charge des portails. Améliorer l’alignement des entités numériques avec des entités réelles passe souvent par un travail de dédoublonnage et de correction qui est également effectué à l’aide de auréHAL. Ceci est central pour plusieurs services et fonctionnalités, comme les CV pour les auteurs, les portails pour les institutions, et les collections selon des critères spécifiques.
Ces données sont accessibles sous la licence CC0 depuis différentes interfaces, sous différents formats et protocoles.
La conférence PIDfest
Cette conférence était pour moi une occasion de découvrir et avoir des retours d’expériences sur les méthodes et les politiques mises en place par les différents organismes au niveau international afin de sensibiliser, accompagner, et encadrer l’usage des PIDs dans le but de répondre aux attentes et besoin de différents intervenants, étant donnée la multiplicité mais aussi la complémentarité entre les systèmes PIDs, cela nécessite une bonne compréhension de ces systèmes et suivre les bonnes pratiques pour mieux les intégrer et en tirer avantage. Des présentations autours des graphes basés sur les PIDs m’ont permis d’appréhender l’efficacité des PIDs pour constituer une connaissance à l’aide des liens entres différentes entités, et plusieurs d’autres interventions sur des PIDs que j’ignorais, telles que des identifiants pour les échantillons (IGSN), des ressources d’intérêt dans le domaine biomédical (RRID) ou ce projet visant à identifier et attribuer des identifiants pérennes pour des projets et des activités de recherche (RAiD).
Rendez-vous au prochain PIDfest !
Frisch
Cette actualité de la recherche m’intéresse beaucoup.