Parlons science ouverte : les logiciels dans HAL

HALSubscribe

Écrit par CCSD

Le 31 mai dernier, le CCSD a proposé le webinaire “Les logiciels dans HAL : une collaboration entre Software Heritage, Inria et le CCSD”.

La séance réunissait Roberto Di Cosmo (Directeur de Software Heritage), Morane Gruenpeter (cheffe de projet chez Software Heritage), Alain Monteil (responsable du service IES, Inria) et Bruno Marmol (Responsable production et plateformes, CCSD).

Le webinaire  a été enregistré et vous pouvez le découvrir ici :

Soutenue par le 2ème Plan national pour la science ouverte, Software Heritage (ou SWH) est la première archive universelle du code source des logiciels. Son but est de collecter, partager et permettre de réutiliser les logiciels open source. Une collaboration entre le CCSD, Inria et Software Heritage permet, depuis 2018, le dépôt de logiciels dans  HAL avec transfert vers Software Heritage.

5 bonnes raisons de choisir  SWH et HAL pour le partage des logiciels

Le logiciel est une composante essentielle de la recherche dans toutes les disciplines : sans eux, il est bien souvent impossible d’accéder aux données produites ou de reproduire les expériences menées par d’autres. Le logiciel est alors tout à la fois un outil, un résultat de la recherche et un objet de recherche.

Dès lors, bénéficier de la complémentarité offerte par Software Heritage et HAL permet :

  1. d’archiver : l’archivage pérenne du logiciel sur Software Heritage garantit l’accessibilité du code sur une plateforme dédiée et sa reproductibilité afin de transmettre aux générations futures les connaissances scientifiques actuelles ;
  2. d’identifier : le référencement du logiciel  à des fins de reproductibilité est facilité grâce à l’identifiant SWHID (Software Heritage ID) –  pour accéder au contenu exact archivé sur la plateforme Software Heritage- , et à l’identifiant du dépôt HAL qui embarque des métadonnées descriptives ;
  3. de décrire : la description du logiciel avec des métadonnées de qualité, et vérifiées,  contribuent à une meilleure visibilité ;
  4. de citer : une citation complète, disponible dans différents formats d’export, facilite l’interopérabilité et  les liens entre publications, données et codes source ;
  5. et bien sûr de valoriser le logiciel pour une meilleure dissémination de la production scientifique.

Comment faire ?

Ce sont les codes sources et non les exécutables qui sont déposés, et le dépôt est réservé aux milieux académiques. Ne peuvent déposer sur HAL que les auteurs/créateurs des logiciels et leurs représentants.

Il y a deux voies d’alimentation de HAL :

  • le dépôt classique : dépôt des sources sous format compressé (.zip, .tar.gz) et ajout des métadonnées (auteurs et affiliations, licence, etc) . Une fois mis en ligne sur HAL, le code source est transféré à Software Heritage qui attribue un SWHID. Le dépôt HAL est ensuite mis à jour avec le SWHID.  On compte actuellement plus de 300 dépôts.
  • le dépôt SWHID, en test actuellement sur le portail HAL-Inria : le code source a été collecté par Software Heritage et a déjà un identifiant SWHID. Le dépôt dans HAL consiste à déposer cet identifiant et compléter les métadonnées. Si un fichier codemeta.json est déjà associé au SWHID, les métadonnées seront extraites pour compléter le dépôt.
    Dans les deux cas, la cohérence entre les métadonnées et le contenu des fichiers  AUTHORS, README  et LICENSE est vérifiée avant mise en ligne.

Les prochains chantiers à mener concernent tout à la fois l’amélioration des formats d’export, l’amélioration de la prise en charge des liens entre les objets logiciels, l’intégration des logiciels dans HAL Data et l’organisation de la modération des logiciels au niveau de la communauté.

Laisser un commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.