Triplestore

Le portail data.archives-ouvertes donne accès à la base de données contenant des données structurées au format RDF. Cette base de données, également appelée Triplestore, contient toutes les données présentes dans l’archive ouverte HAL ainsi que dans les différents référentiels d’AuréHAL

Le RDF, pour Resource Description Framework, est le langage de base pour le web sémantique. Il propose un modèle de graphe destiné à décrire de façon formelle les ressources web et leurs métadonnées, de façon à permettre le traitement automatique de ces descriptions.

Un document structuré en RDF est un ensemble de triplets.

data.archives-ouvertes utilise les vocabulaires et ontologies suivants :

Le portail data.archives-ouvertes propose :

  • une documentation qui présente le triplestore et les différents schémas de données
  • un SPARQL endpoint : Interface d’interrogation de la base de connaissance structurée en RDF
  • le téléchargement de l’ensemble des contenus du triplestore : création mensuelle d’une archive zip téléchargeable des données RDF