La Biblioteca Nacional enlaza sus datos

El portal datos.bne.es es una iniciativa de la Biblioteca Nacional de España para enriquecer la web semántica con datos bibliográficos provenientes de su catálogo. Ha contado con la colaboración con el Grupo de Ingeniería Ontológica (OEG) de la Universidad Politécnica de Madrid.

La Biblioteca Nacional enlaza sus datos
La Biblioteca Nacional enlaza sus datos. Foto: Wikipedia

El portal datos.bne.es es una iniciativa de la Biblioteca Nacional de España para enriquecer la web semántica con datos bibliográficos provenientes de su catálogo. Ha contado con la colaboración con el Grupo de Ingeniería Ontológica (OEG) de la Universidad Politécnica de Madrid.

La Biblioteca Nacional se suma al reto de publicar los catálogos bibliográficos y de autoridades en formato RDF (Resource Description Framework) conforme a los principios de los datos enlazados para para mostrar, intercambiar y conectar información. De esta manera, con el portal datos.bne.es, España se adhiere a las iniciativas de otras bibliotecas como las de Reino Unido y Alemania.

El concepto de Linked Data o datos enlazados fue introducido por Tim Berners-Lee dentro del marco de la web semántica. El objetivo del proyecto Linking Open Data desarrollado por el grupo de la W3C es ampliar la web mediante la publicación de bases de datos en RDF y mediante el establecimiento de enlaces entre datos de diferentes fuentes.

El proyecto Datos enlazados en bibliotecas consiste en la transformación y publicación de los catálogos bibliográfico y de autoridades de la BNE en RDF, utilizando las ontologías o vocabularios estándares de la Federación Internacional de Asociaciones de Bibliotecas (IFLA), para que los datos sean accesibles en la web semántica y enlazarlos con otros conjuntos de datos de la nube como el Fichero de Autoridades Virtual Internacional (VIAF), y en un futuro próximo, con DBpedia.

Para poder representar los recursos en RDF, se han utilizado ontologías o modelos consensuados por la comunidad de bibliotecas y propuestos por IFLA, la Federación Internacional de Asociaciones de Bibliotecarios y Bibliotecas.

El portal datos.bne.es representa una de las primeras iniciativas a nivel internacional en hacer un uso intensivo de los modelos propuestos por IFLA, como el estándar internacional para descripción bibliográfica ISBD, o el modelo de requisitos funcionales para registros bibliográficos FRBR, cuyo propósito es proporcionar una forma estandarizada de describir datos bibliográficos que permita el intercambio de registros a nivel internacional.

Dado que los modelos de IFLA están en inglés, se ha realizado un proceso de traducción para generar la terminología en español.

Cerca de siete millones de registros transformados

En la transformación de los aproximadamente siete millones de registros almacenados en formato MARC 21 en los catálogos bibliográficos y de autoridades de la BNE, se ha utilizado la herramienta MARiMbA (MArc Rdf and Mappings generAtor). MARiMbA es una herramienta para bibliotecarios que soporta todo el proceso de generación de RDF a partir de registros MARC 21.

La herramienta permite utilizar cualquier vocabulario (en este caso ISBD y FRBR) y simplifica el proceso de asignación de correspondencias entre los vocabularios elegidos y MARC 21. Como resultado de este proceso se han generado alrededor de treinta millones de tripletas en español con datos de gran calidad y valor cultural, incrementando sustancialmente la presencia del idioma español en la nube de datos.

Una vez se han descritos los datos con los modelos de IFLA y se han generado los catálogos bibliográficos y de autoridades en RDF, el siguiente paso ha sido conectar estos datos con otras bases de conocimiento existentes en RDF dentro en la iniciativa de datos abiertos enlazados. Así, los datos de la BNE se encuentran enlazados o conectados con otros datos procedentes de fuentes de datos internacionales a través de VIAF, el fichero de autoridades virtual internacional.

Acceso a datos de calidad, de gran valor cultural y social

La licencia aplicada a los datos es CC0 (Creative Commons Public Domain Dedication), una licencia completamente abierta y enfocada a favorecer la reutilización. La BNE se suma así al compromiso del Sector Público español en materia de apertura y reutilización de datos según lo establecido en el Real Decreto 1495/2011, de 24 de octubre, sobre reutilización de la información del sector público y a lo propuesto por CENL (Conference of European National Librarians).

El impacto de esta iniciativa ha traspasado fronteras. Los resultados iniciales del proyecto fueron presentados como una de las iniciativas de referencia en la sesión del Grupo de Interés sobre Web semántica de IFLA en el 77 Congreso Mundial de Bibliotecas e Información, organizado por IFLA en Puerto Rico. Por otro lado, el grupo W3C de Datos Enlazados en el dominio de las Bibliotecas ha publicado un informe de casos y aplicaciones de utilidad, como muestra del potencial que brindan este tipo de iniciativas de apertura de datos en formatos de la web semántica.

Dicho grupo, en su informe final, señala los numerosos beneficios derivados por la apertura de datos de instituciones del Sector Público e incluye un conjunto de recomendaciones para el enlazado de datos en bibliotecas. La incorporación de los datos abiertos enlazados de la BNE permitirá a los ciudadanos acceder, con más facilidad, a datos de calidad, de gran valor cultural y social, que se encuentran enlazados con datos de otras bibliotecas internacionales.

A las empresas que utilizan datos culturales les permitirá desarrollar nuevas aplicaciones e ideas de negocio innovadoras que utilizarán los datos abiertos de la BNE. Por último, y no por ello menos importante, los datos enlazados permiten incrementar la interoperabilidad entre las bibliotecas a nivel internacional, nacional, regional y local, lo cual redundará en una mejora de la calidad de los datos que las bibliotecas exponen a la sociedad.

El día 14 de diciembre, a las 13:30, en el salón de actos de la BNE, presentarán esta iniciativa Asunción Gómez-Pérez, catedrática de la UPM, Daniel Vila-Suero, jefe de Proyecto, UPM, Ricardo Santos, jefe de la Sección de Autoridades y Ana Manchado Mangas, jefa del Servicio de Proyectos Bibliográficos. Se contará asimismo con la participación de Gordon Dunsire, presidente del IFLA Namespace Group.

Fuente: UPM
Derechos: Creative Commons