Une priorité des développements HAL pour 2018 concerne la refonte du module de statistiques. Cela englobe l’amélioration des performances, celle de la fiabilité des indicateurs, l’ergonomie de l’interface d’interrogation et l’exploitation des résultats.
Afin de correspondre au mieux aux besoins de ses utilisateurs, le CCSD a proposé une enquête destinée aux administrateurs de portail. Elle est centrée sur les besoins en indicateurs statistiques des établissements et des institutions, concernant les données gérées dans une archive ouverte.

L’enquête s’est déroulée du 1er au 30 mars 2018 : un lien vers un questionnaire en ligne a été adressé à tous les utilisateurs ayant le privilège « administrateur » dans la base de données, soient 411 adresses au total. L’objectif en procédant ainsi était de procéder à un nettoyage de la base de données qui s’est révélé moins important que prévu puisque seulement 10 profils ont été mis à jour : adresse mail erronée, retour de l’utilisateur nous informant qu’il n’est plus administrateur.

66 personnes ont répondu et nous les remercions vivement de leur participation. La dernière question permettait de préciser le nom de son portail : certaines personnes administrant plus d’un portail, cela porte à 69 le nombre total de portails représentés par les réponses à ce questionnaire (57 portails, 12 réponses sans le nom du portail, une personne déclare n’être que gestionnaire de collections). Soit une proportion de 55 % du nombre actuel de portails.

Pour recueillir au mieux les besoins, la plupart des questions étaient volontairement ouvertes. Le rapport complet d’enquête avec les réponses libres est téléchargeable (fichier pdf). Nous reprenons les grandes lignes dans ce billet.

Les premières questions visaient à recueillir plus spécifiquement les besoins en données statistiques, institutionnelles comme spécifiques à l’activité d’administrateur d’un portail. 66 % des répondants sont concernés par l’ Enquête Statistique Générale auprès des Bibliothèques Universitaires(ESGBU) et fournissent  les indicateurs suivants : nombre de notices et documents fulltext, leur accroissement annuel, nombre de visites sur le portail, nombre de téléchargements.

En-dehors des informations demandées dans l’ESGBU, seulement un tiers des 66 répondants sont sollicités par leur établissement ou institution pour d’autres indicateurs.

Le questionnaire laissait un champ libre pour permettre de lister les indicateurs demandés par l’établissement ou l’institution, en majorité une fois par an. 21 personnes ont complété cette partie. Un certain nombre de demandes rejoignent les indicateurs de l’enquête ESGBU mais on peut synthétiser les réponses en classant les indicateurs par catégorie :

  • Les statistiques de consultation des documents (notices et fulltext) : répartition des consultations par pays, nombre de visites des notices, nombre de téléchargements des fulltexts
  • Les statistiques de consultation d’un site : nombre de visites d’un portail
  • Les statistiques d’usage/corpus : nombre de dépôts réalisés dans un portail (notice et fulltext), nombre de documents par type de dépôt (notice/fulltext), accroissement du nombre de fulltext/notices, taux de fulltext, nombre de documents par laboratoire d’une institution, répartition du nombre de notices/fulltext (par type de document, par domaine, par collection liée à un portail, par sous-structure d’une structure, par programme de recherche, par langue du document, etc.

Une question s’intéressait aux besoins spécifiques de l’administrateur pour la gestion régulière de l’archive. Une majorité des 66 répondants déclarent ne pas avoir besoin de statistiques supplémentaires.

24 répondants ont ajouté dans un champ libre leurs besoins spécifiques :

  • Consultation des documents : temps de consultation des vidéos
  • Statistiques d’usage : nombre de notices / fulltext dans un portail, par collection liées à un portail, accroissement du nombre de dépôt par mois, nombre d’articles modérés par modérateur, nombre de dépôts par déposant, répartition par portail de dépôt pour un corpus, répartition des dépôts (par type de document, langue du document,  domaine, avec ou sans DOI,  par département, programme de recherche, par année de publication, année de dépôt, type de licence), proportion d’auto-archivage, nombre de contributeurs actifs d’une structure, accroissement du nombre d’idHAL créés dans la structure par an, accroissement du nombre de contributeurs sur 1 an, nombre de collaborations nationales / européennes / internationales.

Les questions suivantes visaient à recueillir l’avis des administrateurs sur les outils actuellement disponibles. 70% des répondants utilisent l’interface de statistiques (Mon espace/Mes statistiques) et une grande majorité utilise la fonction de filtres pour construire le corpus sur lequel obtenir des statistiques. Les filtres les plus fréquemment utilisés sont le type de document, la date de publication, la structure de recherche et le type de dépôt.

L’interface actuelle est jugée compliquée par 33% des répondants. Elle a en effet été conçue pour être très paramétrable (constitution du corpus avec les filtres, liste complète des métadonnées, etc.), le risque étant qu’elle peut être difficile à prendre en main : 20% % ont du mal à utiliser l’interface. 11% ont besoin d’autres données qui ne sont pas proposées. La formulation de la question retirait les principales critiques généralement exprimées : la limite du nombre de documents qui compose le corpus sur lequel on veut obtenir des statistiques, et l’élimination des hits de consultation en provenance des robots.

Enfin, une dernière question concernait la plateforme piwik. Celle-ci n’est proposée systématiquement aux nouveaux portails que depuis 2017, ce qui explique sa faible utilisation (13% des répondants l’utilisent).

Cette enquête a permis de faire le point sur les besoins des établissements et des institutions en recueillant les avis des administrateurs de portail. La priorité du chantier de refonte du module statistiques est de consolider les données sur les statistiques de consultation et de téléchargement des documents. Dans un second temps, les développements s’attacheront à répondre aux besoins de simplification en proposant une nouvelle interface.