Investigadores de la Universidad Politécnica de Madrid (UPM) han aplicado tenologías semánticas para crear el nuevo portal de acceso al catálogo de la Biblioteca Nacional. Basada en técnicas de datos enlazados, la aplicación ofrece de forma intuitiva y comprensible una búsqueda y recuperación de información más amplia que hasta ahora.
Miembros del Grupo de Ingeniería Ontológica de la Universidad Politécnica de Madrid (UPM) han desarrollado el nuevo portal de acceso al catálogo de la Biblioteca Nacional de España (BNE).
Se trata de un proyecto que propone explorar los datos bibliográficos con un enfoque distinto al tradicional, al integrar el acceso a recursos que hasta ahora eran independientes (autoridades, biblioteca digital e índice de materias) en una única aplicación y enriquecerlos con datos procedentes de otras bibliotecas. Basándose en técnicas de datos enlazados, la aplicación proporciona de forma intuitiva y comprensible una búsqueda y recuperación de información más amplia que la que se obtiene con los sistemas actuales.
El portal datos.bne.es tiene como público objetivo tanto al usuario de la BNE como al especialista informático. El segundo encontrará un banco de datos descrito en lenguaje semántico que puede reutilizar en otras aplicaciones. Para ello, los datos bibliográficos de autores, obras y temas han sido transformados, utilizando la herramienta Marimba, desde la arquitectura tradicional de las bibliotecas en determinados formatos (MARC21) a modelos y estructuras de la denominada web semántica.
Con esta tecnología, los datos pueden exponerse en la web de un modo más reutilizable y en un formato que es interoperable con otras aplicaciones, explotando las relaciones que existen entre los datos propios de la BNE con datos externos de otras instituciones.
El desarrollo permite a la BNE sumarse al reto de publicar sus catálogos bibliográficos y de autoridades en formato RDF (Resource Description Framework), conforme a los principios de los datos enlazados, ambos componentes básicos en la web semántica. De esta manera, se adhiere a las iniciativas de otras grandes bibliotecas nacionales en Francia, Reino Unido, Alemania o EE UU.
La licencia aplicada a los datos es Creative Commons, completamente abierta, como corresponde al propósito de favorecer su reutilización y acercar los datos a la ciudadanía.
Los usuarios del portal encuentran una interfaz que explota las relaciones de los datos y experimenta con nuevos modos de presentación. Además, pueden acceder a aquellos ejemplares que se encuentran digitalizados de la Biblioteca Digital Hispánica. Entre las mejoras, destaca también la ampliación de datos que se ofrecen, tanto de registros bibliográficos como de autoridad.
Desde su lanzamiento, el portal está recibiendo multitud de visitas y comentarios por parte de los usuarios, lo que indica una visibilidad creciente de las colecciones de la BNE. En concreto, desde finales de noviembre de 2014 a finales de febrero de 2015, se ha duplicado el número de visitas diarias hasta un total de más de 40.000 usuarios únicos y más de 155.000 páginas visitadas.
Actividad del grupo de Ingeniería Ontológica
El Grupo de Ingeniería Ontológica, dirigido por la catedrática Asunción Gómez Pérez (que acaba de recibir el Premio Ada Byron a la Mujer Tecnóloga 2015 que concede la Universidad de Deusto), se encuentra en la Escuela Técnica Superior de Ingenieros Informáticos de la UPM.
Sus investigadores han desarrollado aplicaciones en un amplio rango de dominios, como gestión del conocimiento, gestión del ciclo de vida de aplicaciones software, vigilancia tecnológica, anotación de textos y fichas médicas, análisis de sentimiento, comercio electrónico, búsquedas de trabajo y financiación, geolocalización y gestión de proyectos de I+D.
En el campo de los datos enlazados, destacan, además de la aplicación para la BNE desarrollada por el estudiante de doctorado Daniel Vila, los trabajos realizados en colaboración con el Instituto Geográfico Nacional (GeoLinkedData), la Agencia Estatal de Meteorología (Aemet), el Grupo Prisa Digital (El Viajero), el Consorcio Regional de Transportes de Madrid y Fundeu (Terminesp).
Además, este grupo mantiene el capítulo español de DBpedia (proyecto para la extracción de datos de Wikipedia con el propósito de crear una versión en web semántica) y participa en diversas actividades de estandarización del W3C (consorcio internacional que produce recomendaciones para la World Wide Web).