Évolution de la typologie des documents dans HAL

HAL

Écrit par Agnès Magron

La typologie des documents dans HAL évolue et sera disponible prochainement dans le formulaire de dépôt. Un traitement automatique sera appliqué pour adapter la typologie des dépôts existants. Cette typologie suit les recommandations d’un groupe de travail piloté par le CCSD.

Les principaux changements

Globalement la typologie évolue peu. Elle se présente sous une liste à deux niveaux composée de types de documents génériques – le déposant doit obligatoirement en choisir un selon la logique existante – et de types de documents plus précis (ou sous-types), qui sont optionnels mais permettent au déposant de qualifier plus précisément son document s’il le souhaite.

Toutes les métadonnées qui actuellement caractérisent un type de document sont désormais intégrées dans la liste, soit comme type de document générique, soit comme sous-type optionnel. 

C’est le cas pour les 4 sous-types actuels  de  “Autre publication” : Article de blog, Compte-rendu de lecture, Notice d’encyclopédie ou de dictionnaire et Traduction. À l’exception de Compte-rendu de lecture qui devient un sous-type d’Article dans une revue, les trois autres deviennent des types de document génériques.  Article de blog est renommé en Article de blog scientifique. 

C’est aussi le cas pour les images : dès le choix du type de document, le déposant peut préciser de quel type d’image il s’agit : Photographie, Dessin, Carte, Illustration, Gravure  ou Image de synthèse. Certains de ces sous-types de document sont actuellement dans les métadonnées du document tandis que d’autres sont disponibles dans les métadonnées du fichier. 

Vous pouvez qualifier aussi plus précisément vos rapports  à l’aide de sous-types optionnels : certains existent déjà (Rapport de recherche, Rapport technique), Contrat est renommé en Rapport contrat/projet,  et la typologie intègre deux créations : Rapport d’expertise collective et Plan de gestion de données/DMP.  Le but n’est pas de lister toutes les dénominations possibles que peut avoir un rapport, souvent propres à une institution, mais de proposer les plus courants. Si aucun sous-type ne correspond à ce que vous souhaitez déposer, il faut tout simplement utiliser le type de document générique Rapport. 

Parmi les nouveautés, Article de revue peut être qualifié plus précisément : en plus de Compte-rendu de lecture déjà cité, vous pouvez choisir Article de synthèse ou Data paper. Il est entendu que Article de revue signifie article dans une revue scientifique ou article scientifique. 

De même, vous pouvez apporter des précisions sur le type d’Ouvrage (Édition critique, Manuel, Ouvrage de synthèse ou Dictionnaire,encyclopédie) ainsi que pour vos prépublications (Preprint ou Working paper) .

Le type de document actuel Direction d’ouvrage/Proceedings/Dossier est, quant à lui, divisé. Deux nouveaux types de document génériques sont créés :  Proceedings/Recueil de communications et N° spécial de revue/Special issue. Si vous avez dirigé ou coordonné un ouvrage, il faudra désormais choisir Ouvrage et sélectionner, dans les métadonnées auteur, la fonction  “Directeur de la publication” ou « Editeur scientifique ». 

Une page de la documentation est dédiée aux définitions pour chaque type de document.

Comment sera traité l’existant

Une évolution impose aussi le traitement de l’existant afin de l’adapter à cette nouvelle typologie. Les règles de migration des données qui seront appliquées sont les suivantes :

  • Pour Direction d’ouvrage/Proceedings/Dossier : 
    • si le titre contient “actes” ou “proceedings” ou si la métadonnée “titre de congrès” est rempli =  Proceedings/Recueil de communications
    • si le titre de la revue est complété et que le titre du document ne contient ni “actes” ni “proceedings” = N° spécial de revue/Special issue
    • si aucun de ces critères n’est rempli = Ouvrage.
  • Pour Autre publication :
    • si Article de blog = Article de blog scientifique
    • si Compte-rendu de lecture = Article/Compte-rendu de lecture
    • si Notice de dictionnaire/encyclopédie = Notice de dictionnaire/encyclopédie 
    • si Traduction = Traduction
API : les deux typologies sont temporairement conservées

Pour les API,  la nouvelle et l’ancienne typologie sont toutes les deux disponibles afin de laisser le temps aux  utilisateurs d’adapter leurs requêtes. Pour un import sword, les anciens types de documents seront acceptés et convertis en  nouveaux types selon les règles décrites ci-dessus. Pour un export, les deux typologies sont conservées par document.

Exemple avec ce dépôt test :

Travaux du groupe de travail

Faire évoluer la typologie de document de HAL nécessite de considérer tout à la fois les besoins des utilisateurs, l’exigence d’une nomenclature simple et facile à prendre en main, y compris par des personnels non spécialistes des questions documentaires, ainsi que les impératifs d’interopérabilité de HAL avec d’autres plateformes.

Ce sont les objectifs que se sont fixés les membres du groupe de travail lors de leurs réflexions l’année dernière.  Ils se sont attachés à éliminer les sources de confusion en proposant des types de documents clairs, à éviter les types de document trop spécifiques à une discipline afin de se conformer à la multidisciplinarité de HAL.  De plus, pour chaque type de document s’est posé la question du texte intégral correspondant : la logique archive ouverte doit primer sur celle de base de données bibliographiques. Enfin, l’impact  sur les équipes des portails et celle du CCSD a également été pris en compte.

11 comments

  1. Anne O'Nyme

    Il aurait été intéressant d’avoir un groupe de travail composé de chercheurs/chercheuses de différentes disciplines. La typologie, qui je cite « globalement (…) évolue peu », n’est toujours pas opérationnelle puisque tous les types de production scientifique ne sont pas représentés. Très décevant au final, il ne faut pas s’étonner que l’on soit sur Academia ou Researchgate.

    1. Agnès Magron

      Bonjour Anne O’Nyme,
      Dommage que vous trouviez cette nouvelle typologie décevante. Si vous souhaitez en savoir plus sur la façon dont ont travaillé les membres du groupe de travail, le rapport détaillé est disponible ici : https://www.ccsd.cnrs.fr/wp-content/uploads/2021/04/E%CC%81volution-des-types-de-documents-dans-HAL-consultation-rapport-du-GT.pdf
      Cordialement

  2. Aussenac-Gilles Nathalie

    Merci pour ce travail qui représente une avancée intéressante Cependant, dans des communautés comme l’informatique, où l’on publie beaucoup sous forme de communications à des conférences/congrès/ workshops avec des actes associés, cela serait très utile de faire des sous-catégories dans cette catégorie que nous jugeons trop « fourre-tout ». Par exemple, les congrès nationaux versus internationaux ; dans ces congrès, articles courts/ longs ; enfin, distinguer conférences et workshops spécialisés ; congrès avec ou sans actes édités.
    Merci bien si vous pouvez tenir compte de cette demande. Bien sincèrement

    1. Agnès Magron

      Bonjour.
      Pour tous les types de documents, si vous souhaitez distinguer l’audience (nationale vs internationale) vous pouvez utiliser la métadonnée « audience ». De la même façon, pour les communications, la métadonnée « acte » vous permet de préciser si la communication est parue dans des actes ou non. En croisant ainsi plusieurs métadonnées (type de document + audience + acte) vous pouvez qualifier vos publications sans qu’il soit besoin de créer une liste de types de documents composée de toutes les variantes possibles. Le choix de HAL, respecté par le groupe de travail, est en effet de proposer une typologie simple à appréhender.
      Pour les articles courts/longs, comment déterminer ce qui est court ou long ? Cela peut être spécifique à l’organisation d’un colloque ; selon les disciplines, cela peut être apprécié différemment.
      Enfin, « Communication dans un congrès » englobe toute communication présentée lors d’une manifestation scientifique : certain l’appelleront colloque, d’autres conférence, d’autres encore workshop ou séminaire. Les appellations sont tellement diverses, parfois propres à une discipline, ou pas forcément constante dans le temps.
      Cordialement

  3. Laurent Jonchère

    Merci pour ce travail d’enrichissement de la typologie. Je vois que la nouvelle typologie apparaît désormais dans le formulaire de dépôt. Pouvez-vous s’il vous plaît me confirmer que le traitement de l’existant et la migration des données ont bien également été appliqués à ce jour ? (cet article de blog en parle au futur). Combien de temps l’ancienne typologie en API sera-t-elle conservée ? Merci.

    1. Agnès Magron

      Bonjour,
      La migration et la ré-indexation des documents existants est complète : elle s’est faite en même temps que la mise en production de la nouvelle typologie.
      Pour les API, l’ancienne typologie restera disponible jusqu’au 30 juin 2023.
      Cordialement

  4. Françoise Pinsard

    Je veux bien être informée en tant que référente structure et responsable de collections des références qui changent de type/sous-type lors de la migration.

    Merci de penser à faire évoluer le plugin WordPress HAL en conséquence. D’ailleurs, si on pouvait avoir un paramètre ou un toggle en plus pour choisir le type de documents à afficher, ce serait parfait. cf. le résultat de notre utilisation actuelle de cet outil (merci aux auteurs !) :https://www.locean.ipsl.fr/recherche/publications/

    J’espère que cette évolution ne va pas remettre en question le déploiement de https://appui-evaluation.hceres.fr/hal très attendu pour la vague D de l’Hcéres.

    Un dernier commentaire : ajout de types DataPaper et DMP, cela m’étonne peu. N’est-ce pas le rôle des infrastructures de recherche comme Dataterra ou pangea dans nos disciplines de rassembler ce genre de document. Je suis le risque de doublons… Jusqu’à présent je préconise plutôt de compléter la metadonnee « jeu de données associé » avec un DOI plutôt que de référence le DOI des données elles-mêmes.

    1. Agnès Magron

      Bonjour,
      Pour le plugin WordPress, il n’est pas encore mis à jour mais le sera prochainement. Le code source est disponible en ligne et toute contribution est la bienvenue pour une mise à jour plus rapide ou pour l’améliorer.
      L’Hcéres a bien pris en compte l’évolution de la typologie des documents disponibles dans HAL.
      Enfin, en ce qui concerne votre dernier commentaire, le groupe de travail a intégré les DMP et les data papers parce que cela correspondait à une demande de valoriser ces publications. Les auteurs peuvent ainsi les afficher dans leur CV HAL ou les associer avec les autres publications financées par un projet ANR. Ce n’est pas le même objectif qu’un entrepôt de données.
      Cordialement

  5. LEVEAU Philippe

    J’observe pour ma part autant que je peux les recommandations de déposer mes publications dans HAL et cette année dans deux cas, s’agissant de travaux collectifs, celles-ci l’ont été par les collègues qui pilotaient l’ouvrage ou la recherche dans laquelle celle-ci s’inscrivait. Mais, comme il a été relevé dans un commentaire précédent, si cela répond à une demande de l’Université, cela ne fait pas double emploi avec Academia ou Reacherche qui nous tiennent au courant des publications déposées sur leur site dans notre domaine de recherche. Je n’ai jamais pour ma part compris comment on pouvait accéder à un article qui était dans HAL. La fracture numérique est une réalité qui frappe la partie des chercheurs attachés aux supports écrits et à la consultation de revues ou de mélanges où ils trouvent parfois des informations qu’ils n’attendaient pas. Sans doute serait-il opportun de s’en préoccuper.

    1. Agnès Magron

      Bonjour,
      Pour vous aider à faire une recherche dans HAL, je vous suggère de consulter cette page de la documentation : https://doc.archives-ouvertes.fr/rechercher-simple-avancee/. Sachez aussi que si vous souhaitez être informé des nouveaux dépôts sur un sujet de recherche par exemple, vous pouvez enregistrer vos requêtes et créer des alertes (Mon espace/Mes recherches) : vous serez averti par mail dès qu’un nouveau dépôt correspondra à votre requête.
      Cordialement

  6. Marie GILLET

    Bonjour,

    Je suis un peu surprise que nous puissions pas distinguer nettement une monographie d’un ouvrage collectif. La distinction n’apparaît pas sur les notices (sauf si on sélectionne « détails » à côté du nom de l’auteur). Par ailleurs, je me suis aperçue que les directeurs d’ouvrages des anciennes notices Direction d’ouvrages étaient dorénavant mentionnés en tant qu’auteur dans un ouvrage. À moins de modifier la fonction des auteurs dans les anciennes notices, il est impossible de distinguer une monographie d’un ouvrage collectif. N’y aurait-il pas un moyen moins chronophage que de tout reprendre manuellement ?

    Je vous remercie par avance,

Répondre à LEVEAU Philippe Annuler la réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.