Han pode usar este algoritmo para jugar al Pitfall de Atari y, aunque los anteriores eran incapaces de hacer ni un solo punto, ya mejora a los humanos

Compartilhar no facebook
Compartilhar no google
Compartilhar no twitter
Compartilhar no linkedin
Clique aqui para visualizar a página da web original em www.xataka.com

Artículo seleccionado, original en www.xataka.com


Han pode usar este algoritmo para jugar al Pitfall de Atari y, aunque los anteriores eran incapaces de hacer ni un solo punto, ya mejora a los humanos

¿Puede un algoritmo explorar entornos complejos o, en cambio, hay que dárselo todo mascado? Es decir, ¿Podemos entrenar sistemas de inteligencia artificial para que tomem decisões explorando y comprendiendo entornos complicados e para que aprendam a adquirir recompensas de manera óptima? Esa es la pregunta que Adrien Ecoffet, Joost Huizinga e sus colegas llevan años tratando de responder y la verdad es que es una pregunta compleja.

Por suerte, tenemos videojuegos.

Algoritmos vs videojuegos

Sim, si lo pensamos un momento, los videojuegos filho um marco fantástico para entrenar inteligencias artificiales en este tipo de decisiones (y de probar que metodología funciona mejor): tienen todo lo necesario para aprender en entornos sucesivamente más complejos, permitir estabelecer recompensas basadas en llegar a una ubicación específica o completas un nivel en un videojuego y, de hecho, suponen un reto incluso para los humanos mismos.

Inteligencia artificial, eres una pillina: hacer trampas para ganar a los videojuegos es ya algo trivial para las máquinas

Ecoffet y su equipo trabajan con algoritmos de aprendizaje por refuerzo y decidieron probar sus nuevos enfoques con los videojuegos clásicos de Atari. Concretamente, 'Montezuma's Revenge' e 'Pitfall'. No es solo un arrebato de nostalgia, é que los juegos de Atari 2600 se han convertido em um 'estándar dorado' para este tipo de sistemas. Sin ir más lejos, hasta ahora, los algoritmos conseguían modestas puntuaciones no primero y fracasaban miserablemente en el segundo: no conseguían ni un solo punto.

La familia de algoritmos que desarrolla el equipo de Ecoffet (llamada Go-Explore) cambia el asunto, según acaba de publicar la revista Nature. La idea es que los GO-Explore pueden explorar entornos em profundidade e criar um arquivo para ayudarlos a recordar dónde han estado, asegurándose de no olvidar la ruta hacia una etapa intermedia prometedora o un resultado exitoso.

Y com esas herramientas, los algoritmos de Go-Explore cuadriplican las puntuaciones anteriores en 'Montezuma's Revenge' y supera el rendimiento humano promedio en 'Pitfall' (donde, como ya decía, los algoritmos anteriores no lograron obtener ningún punto).

Tras este éxito, y siempre según los datos de 'Nature', los pesquisadores han engenheirados los mismos algoritmos a tareas robóticas que simulan recoger y colocar objetos con un brazo robótico (en ubicaciones aisladas detrás de puertas con cerrojo). Sim una buena noticia porque aún queda mucho para que uma IA pueda ganarnos em Fornite, el mero hecho de que lo hagan en juegos de 1982 es síntoma de que pronto lo harán (y que eso tiene interesantes aplicaciones prácticas).

Imagen | Atari - Vijoy Rao

Vamos começar uma conversa

Este site usa cookies para garantir que você obtenha a melhor experiência em nosso site.