EquipeX+ HALiance

 

Le projet HALiance vise une refonte des services cœur de HAL et un alignement sur les recommandations et les critères d’excellence définis par l’ESR français (Plan National pour la Science Ouverte) et dans le cadre des initiatives internationales en faveur de la science ouverte (COAR, EOSC, cOAlition S). Il s’appuie sur une renouvellement du socle matériel et logiciel. Il doit permettre à  HAL de répondre aux enjeux internationaux d’excellence, d’agilité technologique et d’interconnexion renforcée.

Le projet est divisé en 9 lots (workpackages).

WP1 - Infrastructure matérielle

Objectifs : Mettre à niveau et sécuriser l’infrastructure physique de HAL
Livrables :
  • L’infrastructure physique de HAL est en capacité de s’adapter à une augmentation conséquente des données à stocker et à traiter,
  • Le système de sauvegarde est redondant,
  • Démarches de mise en œuvre d’un Plan de continuité d’activités.

 

Réalisations :

 

2022

 

Mise en place du répartiteur de charge HAProxy ALOHA

Changement d’un switch (passage à un switch optique)

Mise en place d’un cluster SolR

Installation d’un cluster Mysql pour usage futur

Instruction technique d’une solution de sauvegarde redondante

2023

Recrutement d’un Ingénieur système

Nouveau serveur de stockage NAS

Basculement sur HaProxy pour garantir la  haute disponibilité

Amélioration des performances réseau (Installation de switchs optiques et de  cartes 10gb)

Préparation de la sauvegarde des données dans un second datacenter

WP2 - Infrastructure logicielle

Objectifs : Migrer, sécuriser et ouvrir le code logiciel HAL
Livrables :
  • Un nouvel environnement de développement applicatif est déployé,
  • Le code source de HAL est ouvert et publié.

 

Réalisations :

 

2022

 

Études d’architectures et de migration

Constitution du product backlog (ensemble des fonctionnalités et des tâches, priorisation)

2023

Recrutement d’un développeur

Démarrage du projet de migration applicative (prestation)

WP3 - Extraction et alignement des métadonnées

Objectifs : Récupérer des métadonnées et des identifiants dans les fichiers déposés et enrichir automatiquement la base HAL
Livrables :
  • La récupération des entités nommées au sein des fichiers pdf des publications est optimisée et automatisée : Auteurs, Institutions, Financeurs et Projets, Licences, Infrastructures, citations de logiciels et de données de la recherche ;
  • Les entités nommées sont alignées automatiquement sur les données de référence de HAL

 

Réalisations :

 

2022

 

Études de faisabilité pour l’amélioration de l’extraction des mentions de financement et de licences depuis le texte intégral

Définition des spécifications du service d’affiliation automatique des auteur·es

Échanges avec les partenaires Inria et Science-Miner

2023

Enrichissement de auréHAL avec l’identifiant ROR, en collaboration avec l’équipe du Baromètre de la Science Ouverte (BSO)

Étude préliminaire et prototype de la récupération automatique des données sur les financements dans les fichiers pdf (partenaire Science-Miner pour évolution de l’application Grobid)

Préparation de la refonte du service d’affiliation automatique des auteurs

WP4 - Gestion des métadonnées bibliographiques importées

Objectifs : Organiser et documenter le cycle de vie des métadonnées bibliographiques importées dans HAL
Livrables :
  • La provenance des métadonnées est documentée (conservation des informations relatives à la source)
  • La traçabilité des métadonnées est documentée (conservation des informations sur le cycle de vie des métadonnées, les actions de création, modification et suppression)
  • Des règles de gestion de conflit sont définies et implémentées
  • Les données importées sont synchronisées avec celles de la base HAL

 

Réalisations :

 

2022

 

Définition des spécifications (traçabilité des métadonnées, règles de gestion de conflit)

Échanges avec le partenaire IN2P3

2023

Les actions de ce work package dépendent de l’avancée du WP2

WP5 - Qualification des preprints

Objectifs : Articuler HAL à des dispositifs de relecture des preprints et rendre visible le cycle de la publication
Livrables :
  • HAL est automatiquement notifié du reviewing d’un preprint et des versions mises à jour du preprint
  • Les différents statuts du preprint sont connus et affichés (preprint relu, recommandé, accepté pour publication, différentes versions du preprint, open peer review, etc.)
  • Les chercheurs qui déposent des preprints dans HAL se voient proposer des services externes de relecture

Les actions s’inscrivent dans la continuité du projet HALOWIN. Celui-ci s’est terminé fin 2023.

WP6 - Collecte ciblée de publications

Objectifs : Mettre en œuvre une nouvelle voie d’alimentation de HAL par la collecte de publications scientifiques (texte intégral)
Livrables :
  • Un mécanisme permet de repérer les publications scientifiques pouvant être intégrées à HAL et d’alimenter HAL avec elles
  • Des outils de dédoublonnage, d’enrichissement et de gestion de version sont disponibles
  • Des chercheurs disposent d’interfaces web pour valider ou non l’import de leurs publications dans HAL
  • Les communications présentes dans la plateforme SciencesConf sont transférées vers HAL de manière automatisée

 

Réalisations :

 

2022

 

Exploitation du corpus produit par l’Inist dans le cadre du projet CorHAL

Démarrage de l’implémentation du service

Recrutement d’un développeur

2023

Mise en production du service de suggestions de dépôts : interface utilisateur, back office de suivi, workflow de reversement dans HAL

WP7 - Liens publications - données de la recherche

Objectifs : Articuler les publications présentes dans HAL et les données de la recherche qui y sont liées
Livrables :
  • Une solution automatisée repère et associe à la publication déposée dans HAL l’identifiant et la citation des données associées
  • Un service permet de déposer un jeu de données associé à une publication et de le transférer vers l’entrepôt de données idoine
  • HAL est interopérable avec Nakala (SHS) et les entrepôts Dataverse (notamment Recherche.data.gouv)

 

Réalisations :

 

2022 Échanges avec le partenaire INRAE dans le cadre de l’entrepôt national recherche.data.gouv
2023

intégration du protocole COAR Notify dans HAL

WP8 - Accompagnement et engagement des communautés

Objectifs : Assurer la visibilité et l’appropriation des nouveaux services HAL par ses utilisateurs
Livrables :
  • Les utilisateurs de l’équipement sont associés à la conception des nouveaux services HAL
  • La documentation fonctionnelle et technique est disponible
  • Une offre de formation multi-modale est proposée aux utilisateurs de l’équipement
  • Les utilisateurs de l’équipement sont informés de l’avancement général du projet

 

Réalisations :

 

2022

 

Définition d’un plan de communication

Définition d’un plan d’action pour l’implication des utilisateurs

2023

Campagne d’alignement ROR (WP3)

Recueil des avis utilisateurs pour le nouveau service de suggestions (WP6)

Rédaction de la documentation utilisateur sur le service de suggestions

Publication de plusieurs billets de blog sur le site web du CCSD

WP9 - Principes FAIR

Objectifs : Garantir la cohérence avec les principes FAIR
Livrables :
  • Une démarche de certification Core Trust Seal est engagée
  • Des indicateurs FAIR sont mis en œuvre

 

Réalisations :

 

2022 Recrutement d’un data steward pour prendre en charge la certification CoreTrustSeal
2023 

Recrutement d’un data steward

Audit en interne en vue de la certification CoreTrustSeal, collecte des informations pour la rédaction du rapport

Rédaction des pages about.hal.science

Fiche signalétique du projet

Financeur

Équipements structurants pour la recherche du P.I.A.3 – ESR/EquipEx+

Référence projet

21-ESRE-0047

Durée du projet

5,5 ans

Financement

3,4 M€

Début du projet

janvier 2022

Consortium

CNRS, Inria, IN2P3, INRAE

Partenariats

Equipex+ Commons
(OpenEdition, Metopes, Huma-Num)