dataHAL es una base de datos, también llamada triplestore, y contiene todos los datos presentes en el archivo abierto HAL, así como en los distintos repositorios de AuréHAL.
El RDF (Resource Description Framework), es el lenguaje básico para la web semántica. Propone un modelo gráfico destinado a describir formalmente los recursos web y sus metadatos, a fin de permitir el procesamiento automático de estas descripciones.
Un documento estructurado en RDF es un conjunto de tripletes.
dataHAL utiliza los siguientes vocabularios y ontologías:
- FaBiO, the FRBR-aligned Bibliographic Ontology
- Bibo, Bibliographic Ontology
- Dublin Core
- FOAF
- SKOS, Simple Knowledge Organization System
dataHAL ofrece:
- Una documentación que presenta el triplestore y los diferentes esquemas de datos
- Un SPARQL endpoint: interfaz de consulta de la base de conocimiento estructurada en RDF
- Descarga de todo el contenido del triplestore: creación mensual de un archivo zip descargable de datos RDF