Investigadores de la Universidad de Granada han diseñado un novedoso sistema de búsqueda de información para la web del Parlamento de Andalucía. Se trata de un motor de búsqueda basado en modelos matemáticos bayesianos (sobre cálculos de probabilidades), es decir, basado en Técnicas Avanzadas de Inteligencia Artificial (TIA).
Este buscador permitirá al usuario hacer consultas a través del lenguaje natural; la respuesta, en vez del PDF actual, será más precisa y más flexible. Permitirá al interesado obtener partes concretas de un discurso sólo con introducir una palabra, en vez del discurso completo, o hacer búsquedas estructuradas para ofrecer aún más precisión. Además, estos investigadores han logrado que los vídeos de los plenos aparezcan sincronizados con el texto que busca el usuario.
¿Qué otras diferencias tiene con los buscadores habituales? “Normalmente se utiliza un sistema vectorial, que representa los documentos sólo en función de las palabras que contienen -explica Luis M. de Campos Ibáñez, director del proyecto. Su modelo es estructurado, y permite aprovechar también los conjuntos de palabras, los párrafos, las secciones, y los capítulos, así como la estructura del discurso político para hacer la búsqueda más provechosa.
“Todos los parlamentos tienen un buscador”, comenta el investigador. De hecho, la información documental del Parlamento andaluz cuenta, según los últimos datos registrados a 2005, con más de 2.700 BOPA (unas 130.000 páginas), 2.004 diarios de sesiones (84.500 páginas), y 12.000 horas de grabación; cifras que aumentan día a día. Y el Parlamento quiere que todo el trabajo que allí se desarrolla esté a disposición del público.
“Por eso nosotros hemos querido montar un buscador a través de Internet mucho más sofisticado. No existe algo así en ningún parlamento autonómico español -añade- y, que nosotros sepamos, sólo en Holanda y en Gran Bretaña se están desarrollando sistemas similares”.
Esta herramientaha sido presentada de forma oficial en el Parlamento. El siguiente paso será la mejora de las prestaciones. “De momento, el prototipo funciona con el material de la última legislatura, la octava. Y lo que nosotros queremos es incorporar todo el fondo documental de todas las legislaturas”, asegura.