Investigadores de la UPM y la UAM participan en el proyecto

Nace la Wikipedia semántica en español

La DBpedia o wikipedia semántica está ya accesible en lengua española en internet, con casi 70 millones de datos que representan el 80% de la información en español de Wikipedia. Se trata de una web para desarrolladores que gestionan datos semánticos, aunque tiene aplicaciones útiles para profesionales del sector infomediario o los periodistas. Preguntas como cuántos toreros españoles se casaron con cantantes de copla tienen respuesta gracias a esta web.

DBpedia en español. Fuente: DBpedia

Después de meses de trabajo y de colaboración desinteresada de universitarios y expertos, acaba de nacer la versión española de DBpedia, también llamada Wikipedia semántica en español. La DBpedia en español nace con casi 70 millones de datos que representan el 80% de la información en español de Wikipedia, alcanzando el nivel de la DBpedia en otros idiomas, como el inglés o el francés.

Gracias a este esfuerzo colectivo ya es posible, por ejemplo, preguntar en esta página cuántos toreros españoles están (o estuvieron) casados con cantantes de copla y obtener la siguiente respuesta: Ortega Cano con Rocío Jurado, Curro Romero con Concha Márquez Piquer, y Francisco Ribera con Isabel Pantoja.

DBpedia es un proyecto para la extracción de datos de Wikipedia y la construcción de una versión semántica de esta gran enciclopedia de internet. Es un esfuerzo de la comunidad por extraer información estructurada de Wikipedia y hacerla accesible a través de internet.

Esta información se genera mediante la ejecución de documentos de transformación, que permiten especificar cómo los datos se transforman al lenguaje de la 'web semántica' (RDF) de acuerdo con vocabularios comúnmente utilizados por un gran número de organizaciones. El lenguaje RDF es un estándar del consorcio de la world wide web para la representación de datos en la web, y es la base de la 'web de datos',

Para desarrolladores, periodistas e infomediarios

El proyecto DBpedia ha generado durante mucho tiempo información semántica a partir de la wikipedia inglesa. Desde junio de 2011 el proceso de generación de información extrae información de wikipedia en 15 de sus versiones o idiomas.

Uno de ellos es el español, al que el comité de internacionalización de esta iniciativa ha asignado un sitio web y un punto de consultas (SPARQL Endpoint), al igual que a los demás idiomas. La nueva web está desarrollada y sostenida por un equipo liderado por los investigadores Mariano Rico de la Universidad Autónoma de Madrid (UAM) y Óscar Corcho de la Facultad de Informática de la Universidad Politécnica de Madrid (UPM), pertenecientes a la Red Temática Española de Linked Data, así como de particulares que dedican su tiempo y su esfuerzo a esta iniciativa.

Es una web pensada para desarrolladores, que mantienen y gestionan los datos semánticos, si bien tiene aplicaciones directamente relacionadas con colectivos profesionales específicos, como los periodistas de datos y el sector infomediario, entre otros.

Los periodistas de datos (data journalists) buscan documentos relevantes pero poco accesibles, los contrastan y construyen historias en torno a ellos, presentándolos mediante infografías o visualizaciones. El sector infomediario está formado por el conjunto de empresas que generan aplicaciones, productos y servicios de valor añadido destinados a terceros, a partir de la información del sector público.

DBpedia, al extraer datos de Wikipedia, detecta también posibles errores de origen que pueden ser comunicados a los editores para que los corrijan, lo que añade valor a su enorme potencial social.

--------------------------

Más información: Oscar Corcho participó recientemente en un coloquio en Radio Nacional de España donde se explica esta iniciativa.

Fuente: UPM
Derechos: Creative Commons
Artículos relacionados