El Data Management Group de la Universitat Politècnica de Catalunya (UPC) ha creado un sistema denominado 'DEX' con múltiples aplicaciones para explorar la información en distintos campos. Desde la detección de fraude, la biomedicina o la enseñanza, hasta las redes sociales e Internet, incluyendo análisis de la información de Wikileaks.
El Data Management Group de la Universitat Politècnica de Catalunya (DAMA-UPC) ha ideado un sistema de exploración de información en forma de red o grafo que puede complementar los buscadores de Internet y que tiene un interés especial en los ámbitos de las redes sociales e Internet, la biomedicina, la detección de fraude en distintos entornos, la enseñanza y la búsqueda bibliográfica avanzada.
El director del grupo DAMA-UPC, Josep Lluís Larriba, plantea hacer uso de esta tecnología para extraer información de la red Wikileaks, desde dos puntos de vista: para obtener indicadores genéricos que aporten, por una parte, información para conocer si la red de información tiene las características de una red social o bien si se crean comunidades de datos que hace pensar en grupos que aportan información relevante.
Por otra, también para analizar cómo evoluciona una temática determinada en el tiempo, a través de los distintos documentos alojados en la web, cómo se relaciona una persona o un grupo de personas con diferentes temáticas, o bien cómo se interrelacionan los documentos, entre otros aspectos.
Consultas complejas a alta velocidad
La nueva tecnología DEX patentada por la UPC permite explorar y consultar grandes volúmenes de datos en forma de red. El sistema ofrece una alta velocidad de procesamiento, la entrada de datos configurable a partir de fuentes heterogéneas y la gestión de redes con miles de millones de nodos y conexiones en un PC de sobremesa.
DEX permite hacer consultas a partir de valores tan sencillos como nombres y palabras clave, de forma que el usuario puede llegar a identificar gráficamente, de forma fácil y rápida, registros que mantienen algún tipo de relación. Hasta el momento, esto era posible de forma limitada con la tecnología en bases de datos del momento, pero DEX permite extraer información nueva de las interrelaciones, y mejora la velocidad y la capacidad de hacer consultas complejas en grandes redes de información.
Ahora, el equipo DAMA-UPC, que ve un gran potencial de aplicación de esta tecnología en el campo de las redes sociales e Internet, propone utilizar el sistema DEX para analizar la información de Wikileaks, la organización mediática internacional que a través de su web publica informes anónimos y documentos filtrados.
De la detección de fraude a la evolución del cáncer
La aplicación pionera de DEX ha sido, a través de la Agencia Notarial de Certificación, la detección de fraude en las operaciones de compraventa de bienes inmuebles. El Instituto Catalán de Oncología también lo utiliza actualmente en el estudio de la evolución del cáncer en Cataluña.
Ahora, el grupo está estudiando la aplicación de la tecnología DEX para hacer un análisis de datos farmacéuticos, con la finalidad de conocer cómo evoluciona el consumo de medicamentos, entre otros aspectos.
En el ámbito de Internet, también investigan cómo se propaga la información a través de la red, de qué manera y en cuánto tiempo, y cómo algunas noticias se propagan mejor que otras, según tengan o no prescriptores de esta información. El proyecto se desarrolla en el marco del proyecto Social Media, financiado como proyecto estratégico de investigación industrial, dentro del programa de los Consorcios Estratégicos Nacionales en Investigación Técnica (CENIT).
En el campo del aprendizaje digital, están desarrollando un proyecto, seleccionado dentro del programa de ayudas RecerCaixa, orientado a recomendar y explorar contenidos audiovisuales orientados a la enseñanza de primaria y secundaria.
Explorar la información científica
Además de los ámbitos de la salud, la detección del fraude, la enseñanza e Internet, la tecnología del equipo DAMA-UPC también aporta beneficios en el mundo científico.
El grupo ha ingeniado un prototipo único para el Ministerio de Ciencia e Innovación, BIBEX, para explorar el mundo de las publicaciones científicas y relacionar bibliografía específica publicada en el ámbito internacional. BIBEX ofrece otras ventajas a los científicos: permite buscar personas revisoras para la evaluación de publicaciones científicas y permite recomendar artículos en áreas científicas. En el futuro, BIBEX ofrecerá al mundo de la empresa un buen instrumento para detectar grupos científicos de interés en campos comunes de investigación.
Para dar mayor difusión y comercializar estas tecnologías desarrolladas por el grupo DAMA-UPC, este año 2010 han creado la empresa spin-off Sparsity Technologies, con participación de la UPC.