Crean un nuevo protocolo de acceso a las fuentes de información

Un nuevo protocolo de acceso a las fuentes de información, desarrollado en la Facultad de Informática de la Universidad Politécnica de Madrid (UPM), combina las tecnologías Grid con la web de datos, y abre nuevos caminos al mejor aprovechamiento de la vasta cantidad de información en internet.

Crean un nuevo protocolo de acceso a las fuentes de información
Foto: Hermann Kaser.

Investigadores de la Facultad de Informática de la Universidad Politécnica de Madrid han creado un protocolo de acceso a recursos de datos (o fuentes de información) que están definidas mediante RDF(S), que es un conjunto de recomendaciones de la web de datos promovidas por el consorcio W3C para la definición de metadatos (datos acerca de los propios datos) en la Web.

En concreto, RDF(S), uno de cuyos promotores es el “padre” de Internet Tim Berners-Lee, es la combinación del lenguaje RDF, que permite la definición de metadatos, y del lenguaje RDF Schema, una extensión al anterior que permite la definición de vocabularios, que a su vez permiten estructurar los metadatos definidos utilizando RDF.

En la actualidad, el uso de RDF(S) ha trascendido la propia Web y ha empezado a utilizarse en otros contextos. Así, RDF(S) está siendo utilizado para la construcción de ontologías para la representación de información genética, para la publicación de algunas de las bases de datos del programa de recuperación económica del Gobierno de los Estados Unidos o del Reino Unido, o incluso para la representación de la información de la misma Wikipedia o del New York Times.

La diferencia fundamental de RDF(S) respecto a otros lenguajes informáticos es que se ha creado específicamente para el entorno de Internet y para su consumo por parte de las máquinas. Así, los datos que se acumulan en la red de redes así definidos pueden ser procesados de forma automática por aplicaciones informáticas en función de las necesidades de los usuarios, mejorando en última instancia el aprovechamiento de tan vasta cantidad de información.

Grid con web de datos

El protocolo de acceso a recursos de datos definidos mediante RDF(S) que se ha desarrollado en la Facultad, conjuntamente con equipos de Japón (National Institute of Advanced Industrial Science and Technology, AIST) y Reino Unido (National e-Science Centre), combina la tecnología Grid, que permite el uso compartido y coordinado de recursos computacionales geográficamente distribuidos, con la web de datos, poniendo a disposición de ésta la potencia de las especificaciones y tecnologías Grid para la explotación de recursos de datos RDF(S).

La principal ventaja de este protocolo es que ofrece un acceso más robusto a los sistemas que realizan un uso intensivo de este tipo de recursos, ya que permite abstraer al usuario final de los detalles técnicos acerca de la implementación del recurso, al tiempo que proporciona un mecanismo granular para la explotación de sus contenidos.

El resultado de este trabajo de investigación es una herramienta mucho más poderosa y segura para la explotación de recursos de datos RDF(S) que las actuales, y será de gran utilidad para los desarrolladores de sistemas que utilicen este tipo de recursos, ya que proporciona los mecanismos no sólo para la consulta , sino también para la modificación de los propios recursos de datos RDF(S).

Los trabajos para la creación de este protocolo dentro del Database Access and Integration Services Working Group del Open Grid Forum se iniciaron en 2006 y desde entonces se ha trabajado en un documento motivacional y en dos especificaciones para el acceso a RDF(S) en el Grid, una usando un mecanismo declarativo utilizando el lenguaje de consultas SPARQL y otra utilizando un mecanismo programático a nivel conceptual. La primera especificación la lidera el AIST y la segunda la FIUPM.

En la actualidad el protocolo se considera concluido, si bien está sometido a procesos de revisión por los diferentes equipos de expertos. El protocolo se está utilizando ya en varios proyectos en los que participa la UPM, como el UPGrid o ADMIRE, donde se están creando tecnologías middleware para facilitar las tareas de minería e integración de datos de fuentes científicas y comerciales.

Los resultados de esta investigación se han publicado en la revista especializada Concurrency and Computation: Practice and Experience, (vol. 21, nº8, pp. 1029-1051): “Accessing RDF(S) Data Resources in Service-Based Grid Infrastructures”, Miguel Esteban Gutiérrez, Isao Kojima, Said Mirza Pahlevi, Óscar Corcho y Asunción Gómez Pérez.

Asimismo, el trabajo realizado por la FIUPM se ha publicado en una conferencia del área de computación Grid, 8th IEEE/ACM International Conference on Grid Computing (Grid2007) , pp.89-96, 19-21 Sept. 2007, bajo el título: “WS-DAIOnt-RDF(S): Ontology Access Provision in Grids”, firmado por los investigadores Miguel Esteban Gutiérrez, Asunción Gómez-Pérez, Oscar Corcho y Óscar Muñoz García.

Fuente: UPM
Derechos: Creative Commons
Artículos relacionados