Han puesto a este algoritmo a jugar al Pitfall de Atari y, aunque los anteriores eran incapaces de hacer ni un solo punto, ya mejora a los humanos

Compartir en facebook
Compartir en google
Compartir en twitter
Compartir en linkedin
Haga clic aquí para ver la página web original en www.xataka.com

Artículo seleccionado, original en www.xataka.com


Han puesto a este algoritmo a jugar al Pitfall de Atari y, aunque los anteriores eran incapaces de hacer ni un solo punto, ya mejora a los humanos

¿Puede un algoritmo explorar entornos complejos o, en cambio, hay que dárselo todo mascado? Es decir, ¿Podemos entrenar sistemas de inteligencia artificial para que tomen decisiones explorando y comprendiendo entornos complicados y para que aprendan a adquirir recompensas de manera óptima? Esa es la pregunta que Adrien Ecoffet, Joost Huizinga y sus colegas llevan años tratando de responder y la verdad es que es una pregunta compleja.

Por suerte, tenemos videojuegos.

Algoritmos vs videojuegos

Y es que, si lo pensamos un momento, los videojuegos son un marco fantástico para entrenar inteligencias artificiales en este tipo de decisiones (y de probar que metodología funciona mejor): tienen todo lo necesario para aprender en entornos sucesivamente más complejos, permiten establecer recompensas basadas en llegar a una ubicación específica o completas un nivel en un videojuego y, de hecho, suponen un reto incluso para los humanos mismos.

Inteligencia artificial, eres una pillina: hacer trampas para ganar a los videojuegos es ya algo trivial para las máquinas

Ecoffet y su equipo trabaja con algoritmos de aprendizaje por refuerzo y decidió probar sus nuevos enfoques con los videojuegos clásicos de Atari. Concretamente, 'La venganza de Montezuma' y 'Pitfall'. No es solo un arrebato de nostalgia, es que los juegos de Atari 2600 se han convertido en un 'estándar dorado' para este tipo de sistemas. Sin ir más lejos, hasta, los algoritmos conseguían modos de puntuación ahora en el primero y fracasaban miserablemente en el segundo: no conseguían ni un solo punto.

La familia de algoritmos que desarrolla el equipo de Ecoffet (llamada Go-Explore) cambia el asunto, según acaba de publicar la revista Nature. La idea es que los GO-Explore pueden explorar entornos en profundidad y crear un archivo para ayudarlos a recordar dónde han estado, asegurándose de no olvidar la ruta hacia una etapa intermedia prometedora o un resultado exitoso.

Y con esas herramientas, los algoritmos de Go-Explore cuadriplican las puntuaciones anteriores en 'La venganza de Montezuma' y supera el rendimiento humano promedio en 'Pitfall' (donde, como ya decía, los algoritmos anteriores no lograron obtener ningún punto).

Tras este éxito, y siempre según los datos de 'Nature', los investigadores han aplicado los mismos algoritmos a tareas robóticas que simulan recoger y colocar objetos con un brazo robótico (en ubicaciones aisladas detrás de puertas con cerrojo). Y es una buena noticia porque aún queda mucho para que una IA pueda ganarnos en Fornite, el mero hecho de que lo hagan en juegos de 1982 es síntoma de que pronto lo harán (y que tiene interesantes aplicaciones prácticas).

Imagen | Atari - Vijoy Rao

Comencemos una conversación

Este sitio web utiliza cookies para asegurar que usted obtenga la mejor experiencia en nuestro sitio web.