Expertos nacionales e internacionales reflexionan, en el Centro Europeo de Soft Computing, sobre las luces y sombras de los futuros desarrollos tecnológicos en el Análisis Inteligente de Datos.
En la actual sociedad de la información la sentencia baconiana “conocimiento es poder” adquiere una relevancia especial, pues el conocimiento depende de la información disponible. Indudablemente, las actuales redes telemáticas (Internet, telefonía móvil, etc.), así como los sistemas informáticos que desde empresas e instituciones buscan y almacenan datos de forma automática y masiva, nos permiten aparentemente disponer de tal información. Ahora bien, cuando el volumen de información almacenada es tan grande que su manejo va más allá de lo humanamente posible, las máquinas toman el relevo. Es en este contexto de gestión de la información, con la idea de convertirla en conocimiento para su uso humano, donde surgen las técnicas del Análisis Inteligente de Datos (AID).
Durante la segunda edición del Curso Internacional de Verano sobre Soft Computing que organiza cada año el European Centre for Soft Computing (ECSC), ubicado en Asturias, se celebró una mesa redonda donde se destacaron importantes aspectos de la futura repercusión social de las tecnologías vinculadas al análisis inteligente de datos (o minería de datos). En ella, especialistas reconocidos internacionalmente hablaron sobre el potencial de estas técnicas y sobre las posibles dificultades que conlleva su implantación masiva.
Uno de los aspectos más complejos fue señalado por Luis Magdalena, Director del ECSC. Se trata de la preocupación, tanto social como académica, acerca de la protección de información de carácter confidencial recogida en entidades privadas e instituciones públicas. En este sentido, como recordaron los ponentes, el acceso a la denominada “información sensible” está generalmente protegido por técnicas de cifrado, pero el desarrollo de ordenadores cada vez más potentes y rápidos hace que aumenten las probabilidades de “romper” los mecanismos de protección y de esta forma acceder a la información correspondiente. Eso no es propiamente un problema relacionado con las técnicas de análisis inteligente de datos, es más bien un problema genérico de una sociedad que almacena masivamente datos en sistemas informáticos altamente interconectados. Sin embargo, los investigadores deben tenerlo muy en cuenta a la hora de desarrollar técnicas respetuosas de la privacidad.
A diferencia de las técnicas más clásicas de análisis de datos, uno de los objetivos de la investigación en minería de datos (data mining) es el desarrollo de sistemas inteligentes que presenten cierta creatividad y aprendizaje. Es decir, sistemas que, no sólo actúen de forma automática en el análisis y clasificación de datos o en otras tareas propias de estas aplicaciones, sino que sean capaces de interpretar los mismos bajo los intereses requeridos, actuar en consecuencia dependiendo del caso y hacer todo ello de forma autónoma (sin la necesidad de humano que guíe su acción continuamente).
La inquietud puede surgir si nos planteamos la posibilidad de que este proceso inteligencia y automático permita la obtención, a partir de otros datos de uso público, de información confidencial de la que no se disponía con antelación. De hecho, como señaló Larry Hall, profesor de la Universidad del Sur de Florida (Departamento de Ciencia e Ingeniería Computacionales), esta posibilidad de deducción automática de datos privados estaría abierta, dada la gran disponibilidad actual de multitud de fuentes de información.
Actualmente se están tomando importantes medidas legislativas nacional e internacionalmente para la preservación de la privacidad de los ciudadanos (especialmente en los ámbitos médicos y mercantiles). Dado que, entonces, este avance tecnológico puede suponer un reto para su futuro control gubernamental, todos estos especialistas en data mining estuvieron de acuerdo en que los expertos han de comprometerse con la promoción de la bondad pública del progreso tecnológico y, por tanto, ser sensibles a las repercusiones sociales de sus creaciones. Esta conclusión, que surge en el contexto de formación especializada en AID, es prueba de la presencia de tal compromiso.
Su futuro uso generalizado
En realidad, las técnicas de análisis inteligente de datos tienen más luces que sombras. De hecho, y como también destacaron los invitados, más benéficos están por venir. En concreto, el investigador del ECSC, el doctor Christian Borgelt, destacó la necesidad de desarrollar sistemas inteligentes de datos que vayan acompañados de un programa de fácil acceso y uso para usuarios no expertos “porque no todo es estadística ni la gente piensa sólo con números”. Es ahí, pues, donde se encuentra su generalización futura.
En la actualidad, existen una multitud de técnicas dentro del AID que, aplicadas en empresas, centros científicos e instituciones públicas, permiten hacer uso tanto de la información que se encuentra centralizada en sus bases de datos como de aquella pública y descentraliza proveniente de otras fuentes externas. Sin embargo, un problema que limita hoy su uso generalizado y, por tanto, un mayor aprovechamiento de sus ventajas, es el tratarse de técnicas altamente especializadas y cuya aplicación aún requiere del manejo de las mismas por parte de un experto. El reto está, según opinión de los investigadores presentes, en centrar la atención en líneas de investigación que busquen implementar y desarrollar ‘interfaces usuario-máquina’ que faciliten su utilización. De esta forma no sólo las pequeñas empresas, sino incluso cualquier ciudadano individual podría beneficiarse, en este sentido, del recurso de la información.
Actualmente existen muchos grupos de investigación en el amplio campo de lo que se denomina Human Computer Interaction (interacción humano-ordenador), pero queda mucho por hacer. En opinión de Claudio Moraga (ECSC), un campo de estudio fundamental en este caso es el conocido como Computación con palabras. Se trata de una línea de investigación dentro del ámbito de la Inteligencia Artificial que busca el desarrollo de programas computacionales que permitan, no sólo el reconocimiento de palabras y textos del lenguaje natural (como ya se hace, aunque de forma aún muy rudimentaria) sino, y especialmente, su interpretación. Es decir, hacer todo ello de manera similar a como lo haría un ser humano.
Tal búsqueda aún respondería a lo que se denomina ‘ciencia de frontera’ pero, como también señalaron los asistentes, “no estamos tan lejos como podría pensarse y técnicas como la computación con palabras nos ponen en el camino de conseguirlo”.
El Análisis Inteligente de Datos y las técnicas de Soft Computing
También conocido como Descubrimiento de conocimiento en bases de datos (Knowledge Discovery in Databases), se trata de un campo multidisciplinar cuyo objetivo es conseguir una explotación más eficaz de los recursos que se hallan disponibles en las bases de datos. Los sistemas inteligentes diseñados a través de sus técnicas mejoran la búsqueda de patrones que contribuyen al diagnóstico, planificación y toma de decisión. Lo que, a su vez, ayuda a mejorar desde la calidad de un producto, hasta la satisfacción del cliente, pasando por la detección de futuras posibles fugas de éstos últimos.
Muchas son las técnicas que se combinan en los diseños de las soluciones óptimas para los problemas reales que se plantean en tal variedad de procesos industriales, científicos y de gestión en general. Algunas son los algoritmos evolutivos, las redes neuronales y las técnicas probabilísticas. Los alumnos del curso de verano recibieron una enseñanza intensiva en todos ellos, aunque tales técnicas fueron destacadas en combinación con la lógica borrosa (o fuzzy). Frente a la lógica clásica, este tipo de lógica permite manejar datos e información imprecisos o incompletos mejorando, por ejemplo, los procedimientos de predicción, clasificación o agrupamiento en el proceso de análisis.
El Centro Europeo de Soft Computing
El European Centre for Soft Computing, cuya sede está en Mieres (Asturias), es un centro de investigación y desarrollo que, promovido por la Fundación para el Progreso del Soft Computing, comenzó su andadura en febrero de 2006. Al ser un centro de investigación privado pero independiente, se erige como un caso pionero de investigación en este tipo de sector científico-tecnológico en nuestro país y como el único dedicado a Soft Computing en Europa.
Sus objetivos son tanto la investigación básica y aplicada en el área del Soft Computing, como la transferencia de conocimientos y técnicas inteligentes a empresas o instituciones públicas para que puedan mejorar su rendimiento en la resolución de problemas reales.
De ahí que, para continuar con estos compromisos, se invitara a participar este año a representantes nacionales y europeos de los sectores empresarial e industrial para asistir a este Segundo Curso Internacional sobre Soft Computing, sumándose a los habituales estudiantes de postgrado interesados.
Más información: