A mayor premio, más rápido aprende el cerebro: el tamaño de la recompensa revoluciona el aprendizaje

Un estudio con ratones demuestra que los botes grandes prolongan las señales de dopamina en el cerebro, reducen las diferencias individuales y aceleran drásticamente la asimilación de tareas complejas.

Josh Dudman y Luke Coddington, los dos investigadores detrás de este hallazgo. / Toby Hayman/ HHMI

Antonio Villarreal

Siempre se nos había dicho que, para aprender a hacer bien algo, el único camino era la constancia. La experiencia acumulada determinaba, así, la velocidad a la que aprendíamos a ser realmente hábiles jugando al tenis o al póker, independientemente de que el premio final de un torneo fuera cero o un millón de euros. El cerebro, según la teoría tradicional, aprende de forma lenta y gradual mediante la repetición constante, el famoso ensayo y error.

Sin embargo, un nuevo estudio ha puesto en tela de juicio estas suposiciones. Investigadores del Instituto Médico Howard Hughes (HHMI) han descubierto que el tamaño del premio importa mucho más de lo que se pensaba. Los resultados muestran que las grandes recompensas no solo motivan más, sino que reconfiguran la dinámica cerebral del aprendizaje, permitiendo asimilar tareas en un solo día en lugar de semanas.

Confirman la hipótesis del cerebro protector

SINC

La investigación, publicada este jueves en la revista Science, analizó el comportamiento de ratones sedientos a los que se les entrenaba para realizar una tarea determinada. El enfoque clásico en estos experimentos consiste en ofrecer cientos de pequeñas recompensas (similares a dar una sola gominola a un humano) a lo largo de sesiones maratónicas. Nadie se había parado a comprobar qué ocurría si cambiaban radicalmente las magnitudes del incentivo.

Un cambio de paradigma en el laboratorio

“Todo el campo de las neurociencias ha estado haciendo lo mismo durante décadas y lo digo de manera literal: nadie se había molestado en verificarlo”, explica Josh Dudman, director del grupo de investigación y coautor del trabajo. Cuando el equipo decidió alterar las condiciones y ofrecer a los ratones unos pocos tragos grandes de agua en lugar de multitud de sorbos diminutos, los efectos fueron inmediatos y sorprendentes.

Los animales que recibieron los premios de gran tamaño aprendieron la tarea en una sola jornada tras experimentar menos de diez grandes recompensas. Por el contrario, el grupo de control guiado por el método tradicional requirió miles de pequeños estímulos repartidos durante varios días para alcanzar el mismo nivel de pericia.

Todo el mundo en neurociencia ha estado haciendo lo mismo durante décadas y lo digo de manera literal: nadie se había molestado en verificarlo

Josh Dudman, Howard Hughes Medical Institute

Además de acelerar el proceso, el estudio reveló un fenómeno inesperado: la variabilidad entre individuos disminuyó de forma drástica. En condiciones normales, la velocidad de aprendizaje es muy heterogénea; un ratón puede convertirse en experto en una semana mientras que otro necesita un mes para dominar la misma acción. Con un premio mayor sobre la mesa, todos los sujetos de estudio homogeneizaron su rendimiento en cuestión de días.

“Como neurocientíficos, estamos resignados a asumir que vamos a tener que entrenar a un animal durante semanas hasta que empiece a enterarse de qué va la historia”, comenta Luke Coddington, científico sénior del Laboratorio Dudman y líder del estudio. “En lugar de eso, ahora veo a los ratones dominar la tarea por completo en un solo día”.

La clave biológica: señales de dopamina más largas

Para entender el mecanismo detrás de este acelerón cognitivo, los investigadores monitorizaron la actividad química del cerebro. El análisis reveló que las grandes recompensas potencian tres componentes esenciales del aprendizaje: la cantidad de información que se asimila en cada repetición, la capacidad para retener lo aprendido de un día para otro y el nivel de concentración durante la sesión.

El motor de estos tres factores es la dopamina, un neurotransmisor clave en la regulación del aprendizaje y la motivación. El equipo descubrió que los premios voluminosos no solo provocan un pico más alto de dopamina en el circuito de recompensa del cerebro —el cual conecta estructuras como el área tegmental ventral con el núcleo accumbens—, sino que logran que dicha señal molecular se prolongue en el tiempo de manera sostenida.

Creemos que al amplificar y prolongar las respuestas de dopamina en estos experimentos, estamos transformando a todos los 'niños' de nuestra 'clase' en estudiantes brillantemente aplicados

Luke Coddington, Laboratorio Dudman

Para confirmar esta relación causal, los científicos alteraron artificialmente la duración de las señales de dopamina asociadas a los premios pequeños, alargando su presencia mediante herramientas biológicas. El resultado fue idéntico: los animales comenzaron a aprender mucho más rápido, demostrando que la duración de la señal química es el interruptor que activa una mayor atención y asimilación por cada experiencia vivida.

“Creemos que al amplificar y prolongar las respuestas de dopamina en estos experimentos, estamos transformando a todos los 'niños' de nuestra 'clase' en estudiantes brillantemente aplicados”, apunta Coddington en referencia a cómo el grado de implicación elimina las diferencias individuales.

Nuevas fronteras para la cognición animal

Este hallazgo promete transformar la metodología de los laboratorios de neurociencia que estudian el desarrollo de habilidades. Al reducir drásticamente los tiempos de entrenamiento y la disparidad entre los sujetos, los procesos cognitivos se vuelven mucho más accesibles y estables para su análisis en tiempo real.

El Laboratorio Dudman ya ha modificado sus protocolos internos tras los resultados del estudio

De hecho, el Laboratorio Dudman ya ha modificado sus protocolos internos tras los resultados del estudio. “Ha cambiado la manera en la que ejecutamos prácticamente todos nuestros proyectos actuales”, confirma Josh Dudman.

La optimización de los tiempos de aprendizaje abre la puerta a que los investigadores puedan entrenar a modelos animales en tareas de una complejidad muy superior a la que se creía posible, permitiendo abordar preguntas sobre la cognición profunda que hasta ahora permanecían fuera de su alcance. “Si logramos captar su atención e involucrarlos adecuadamente en la tarea, quién sabe qué serán capaces de aprender”, concluye Coddington.

Referencia:

Luke Coddington et al, "Reward magnitude determines reinforcement learning efficiency". Science, 2026.

Fuente: SINC

Derechos: Creative Commons.

Claves