Los algoritmos de aprendizaje por refuerzo son mejores jugando a videojuegos clásicos que los humanos y otros sistemas de IA

Por 26/02/2021 portal-3

Los algoritmos de aprendizaje por refuerzo son mejores jugando a videojuegos clásicos que los humanos y otros sistemas de IA

Un conjunto de algoritmos de aprendizaje por refuerzo han demostrado ser mejores para jugar videojuegos clásicos que los jugadores humanos u otros sistemas de inteligencia artificial.

Los algoritmos han sido desarrollados por un equipo de investigadores de Uber AI Labs en San Francisco.

Futuras aplicaciones

Los algoritmos de aprendizaje por refuerzo aprenden a hacer cosas sintetizando la información proporcionada por un gran conjunto de datos: reconocen patrones y los utilizan para hacer conjeturas sobre nuevos datos. Pero tales algoritmos tienden a tener problemas cuando encuentran datos que no encajan con otros datos. Problemas que han sido subsanados en este nuevo desarrollo.

Para ello, han agregado un algoritmo que recuerda todos los caminos que ha tomado un algoritmo anterior mientras intentaba resolver un problema. Cuando encuentra un punto de datos que no parece ser correcto, vuelve a su mapa de memoria e intenta otra ruta.

Los investigadores probaron su nuevo enfoque agregando reglas de un videojuego y un objetivo: obtener la mayor cantidad de puntos posibles y tratar de lograr una puntuación más alta cada vez. Luego usaron su sistema para jugar 55 juegos de Atari. El nuevo sistema venció a otros sistemas de inteligencia artificial el 85,5 % de las veces. Lo hizo particularmente bien en Montezuma’s Revenge, obteniendo una puntuación más alta que cualquier otro sistema de inteligencia artificial y batiendo incluso el récord de un humano.

Los investigadores creen que su algoritmo podría trasladarse a otras aplicaciones, como el procesamiento de imágenes o lenguaje por robots.


La noticia

Los algoritmos de aprendizaje por refuerzo son mejores jugando a videojuegos clásicos que los humanos y otros sistemas de IA

fue publicada originalmente en

Xataka Ciencia

por
Sergio Parra

.