Equipos de Google DeepMind y de FutureHouse presentan en Nature dos sistemas de inteligencia artificial capaces de colaborar en distintas fases de la investigación científica, desde la generación de hipótesis hasta el análisis de resultados experimentales. Sus autores subrayan que están diseñados para trabajar junto a científicos humanos, no para sustituirlos.
La creciente complejidad de la ciencia exige combinar conocimientos muy especializados con la capacidad de conectar hallazgos procedentes de disciplinas distintas. En ese contexto, dos nuevos sistemas de inteligencia artificial descritos esta semana en Nature exploran una posibilidad hasta ahora limitada: automatizar buena parte del ciclo de investigación científica mediante agentes de IA coordinados entre sí.
Ambas herramientas funcionan como plataformas multiagente, es decir, conjuntos de elementos especializados capaces de asumir tareas concretas dentro del proceso científico. Entre ellas figuran la búsqueda bibliográfica, la formulación de hipótesis, la propuesta de experimentos, el análisis de datos y su reformulación a partir de los resultados obtenidos.
El primero de estos sistemas, denominado Co-Scientist, ha sido desarrollado por Google DeepMind sobre Gemini 2.0. Sus autores lo describen como un “motor de pensamiento científico estructurado” pensado para colaborar con investigadores en distintas disciplinas. Aunque el trabajo se centra en aplicaciones biomédicas, el sistema se plantea como una herramienta generalista.
En las pruebas realizadas, Co-Scientist generó hipótesis para reutilizar medicamentos ya aprobados contra la leucemia mieloide aguda, un cáncer agresivo de la sangre. Algunos de los compuestos sugeridos mostraron actividad en experimentos con líneas celulares. El sistema también propuso posibles combinaciones terapéuticas, identificó nuevas dianas epigenéticas para fibrosis hepática y reprodujo de forma independiente una hipótesis aún no publicada sobre mecanismos de resistencia antimicrobiana.
Según el artículo, el sistema organiza debates internos entre agentes de IA, clasifica hipótesis mediante torneos comparativos y las refina de forma iterativa. Sus autores sostienen que este enfoque mejora la calidad de las propuestas conforme aumenta el tiempo de razonamiento computacional.
El segundo sistema, Robin, ha sido desarrollado por la organización sin ánimo de lucro FutureHouse y utiliza modelos OpenAI o4-mini y Claude 3.7. Está orientado específicamente a la biología experimental y combina agentes dedicados a revisar literatura científica con otros centrados en el análisis automatizado de datos biológicos.
Como demostración, Robin se aplicó a la búsqueda de tratamientos para la degeneración macular seca asociada a la edad, una de las principales causas de ceguera en países desarrollados. El sistema propuso aumentar la capacidad fagocítica de determinadas células de la retina y sugirió varios candidatos terapéuticos para poner a prueba en el laboratorio.
Entre ellos figuraba ripasudil, un inhibidor ROCK (quinasa asociada a Rho, una proteína reguladora intracelular) aprobado en Japón para glaucoma que nunca se había propuesto para esta enfermedad ocular. Los experimentos mostraron un aumento de la fagocitosis en células retinianas tratadas con este compuesto. Robin también sugirió análisis posteriores mediante secuenciación de ARN que permitieron identificar posibles mecanismos moleculares implicados y nuevas dianas terapéuticas.
Los autores destacan que todos los pasos del proceso —desde la generación de hipótesis hasta los análisis estadísticos y figuras incluidas en el artículo— fueron producidos por el sistema de IA dentro de un esquema “lab-in-the-loop”, en el que los científicos supervisan y validan experimentalmente los resultados.
Ambos trabajos insisten en que estas herramientas no eliminan la necesidad de validación experimental ni sustituyen el juicio humano. Las propuestas terapéuticas descritas requieren todavía estudios preclínicos y ensayos clínicos antes de poder considerarse tratamientos viables.
Pese a esas limitaciones, los estudios muestran cómo los sistemas multiagente podrían acelerar tareas especialmente costosas en tiempo y síntesis bibliográfica. En el caso de Robin, los autores estiman que el sistema revisó más de 800 artículos en unos 30 minutos y redujo de forma drástica el tiempo humano necesario para completar un ciclo completo de investigación.