Principes FAIR

Facile à trouver, Accessible, Interopérable, Réutilisable

Les principes FAIR (Findable, Accessible, Interoperable, Reusable) décrivent comment les données doivent être organisées pour être plus facilement accessibles, comprises, échangeables et réutilisables.
On en parle surtout pour les données de recherche mais les principes FAIR concernent toute ressource numérique disponible en accès ouvert relative à une activité scientifique.
La disponibilité croissante de ces ressources en ligne implique que les plateformes qui les hébergent implémentent des protocoles et standards afin que, aujourd’hui comme demain, humains et machines puissent les exploiter. Pour l’archive ouverte HAL comme pour Episciences, le CCSD œuvre depuis leur création afin que les publications et les métadonnées qui les décrivent se conforment pleinement aux principes directeurs de la science ouverte.

Facile à trouver

Ce principe a pour objectif de faciliter la découverte des données :
  • Chaque fichier déposé est décrit par des métadonnées riches (métadonnées bibliographiques, affiliations des auteurs, références de projets ANR/Européen)
  • Les métadonnées du dépôt sont associées à l’identifiant HAL qui est unique et pérenne ; à un identifiant DOI pour les articles publiés sur Episciences
  • Les métadonnées sont indexées et peuvent être recherchées
  • L’accès est libre et gratuit
Protocoles et standards : URI, Dublin Core, TEI, RDF, Datacite (pour Episciences), Sparql

Accessible

Ce principe encourage à stocker durablement les données et à faciliter leur accès :
  • Les métadonnées sont accessibles via des protocoles ouverts et standards
  • Les métadonnées sont accessibles par des API de type REST ouvertes (pas d’enregistrement préalable) ainsi que via OAI-PMH et dans un triplestore
  • Les contenus des documents sont disponibles en accès libre et gratuit
  • Les données sont stockées dans un environnement sécurisé (data center du Centre de Calcul de l’IN2P3) et accessibles via des protocoles ouverts
  • Les documents archivables sont envoyés au CINES pour préserver leur accessibilité et leur lisibilité à long terme
Protocoles et standards : OAI-PMH, API,  RDF Triplestore, OAIS

Interopérable

Ce principe privilégie les langages et formats ouverts, et largement partagés, qui permettent les échanges entre systèmes informatiques et augmentent les capacités des métadonnées à être combinées :
  • Utilisation d’identifiants : DOI, PMID, SWHid, arxivid (voir aussi Principaux identifiants utilisés dans HAL)
  • Alignement avec des référentiels : idRef, ORCID, ROR, RNSR
  • Vocabulaires : DC, RDF, FOAF, SKOS, BILBO, Fabio

Réutilisable

Ce principe affirme le besoin de métadonnées qui fournissent des informations sur la provenance des données et les conditions de leur réutilisation :
  • CGU (en cours d’élaboration)
  • Une licence de diffusion pour le texte intégral peut être ajoutée par le déposant
  • Les métadonnées d’Episciences sont accessibles sous licence CC0
Pour Episciences : les fichiers contenant le texte intégral sont hébergés par les archives sur lesquelles ont été soumis les articles. Ce peut être sur HAL, mais aussi sur arXiv et Zenodo.