Un ordenador aprende a jugar a videojuegos por sí mismo gracias a una red neuronal artificial

Investigadores de la empresa Deep Mind, del gigante Google, han creado un algoritmo capaz de aprender a superar juegos clásicos de la videoconsola Atari 2600, como Space Invaders o el comecocos, a partir de una información mínima. Frente a un probador humano profesional, el nuevo agente artificial logró más del 75% de la puntuación en más de la mitad de los juegos.

Un ordenador aprende a jugar a videojuegos por sí mismo gracias a una red neuronal artificial
El ordenador superó a personas profesionales en más de la mitad de los videojuegos analizados, como Space Invaders. / Taito Corporation

Para los seres humanos es fácil aprender a controlar un videojuego. La experiencia anterior con la máquina o en la propia vida sirve de ayuda para superar pantallas. ¿Pero un ordenador puede hacer lo mismo? Demis Hassabis y su equipo de investigadores en Inteligencia Artificial de la empresa Deep Mind, de Google, se propusieron el reto de crear un algoritmo que permitiera a una computadora aprender por sí sola, sin apenas información previa.

“Su rendimiento se puede comparar con el de un probador profesional humano de videojuegos" aseguran los investigadores

Hasta ahora, el método que habían empleado los ingenieros computacionales era el aprendizaje por refuerzo, basado en el estímulo y la recompensa pero que, según los investigadores, “es limitado en situaciones complejas y su aplicación se limita a los entornos controlables”.

La novedad que aportan los investigadores de Deep Mind es la combinación de este tipo de aprendizaje con una red neuronal artificial a imagen y semejanza de las biológicas. El resultado, publicado en la revista Nature, es un algortimo denominado deep Q-network (DQN) surgido a partir de un aprendizaje por refuerzo 'profundo'.

El estudio muestra que este agente artificial ha aprendido por sí mismo a jugar a 49 videojuegos clásicos de la videoconsola Atari 2600, entre los que se encuentran Pacman (el popular comecocos) o Space Invaders, partiendo de información sobre los píxeles y el número de acciones posibles en cada juego.

“Usamos los mismos datos iniciales para todos los juegos, lo que demuestra que el agente aprende con éxito los procedimientos de cada uno basándose únicamente en las entradas sensoriales”, explican los investigadores.

Capaz de vencer a seres humanos

La máquina superó las puntuaciones de sus predecesoras en 43 de los 49 videojuegos. Pero sus logros no se quedan ahí, según los autores: “Su rendimiento se puede comparar con el de un probador profesional humano de videojuegos. Logró más del 75% de la puntuación humana en más de la mitad de los juegos”.

El método destacó en actividades de índole muy variada, desde los juegos de boxeo a los de carreras de coches en 3D, “lo que demuestra que utilizando la misma arquitectura, la máquina puede aprender a optimizar estrategias en diferentes ambientes”.

Para los investigadores, este algoritmo también puede ayudar a los científicos a entender el proceso de aprendizaje de las personas. Asimismo, esperan que ayude crear productos más útiles, como “mejorar el motor de búsqueda de Google para completar tareas complejas como, por ejemplo, planear un viaje”.

Referencia bibliográfica:

Demis Hassabis et al. "Human-level control through deep reinforcement learning". Nature (25 de febrero de 2015)

Fuente: SINC
Derechos: Creative Commons
Artículos relacionados