Centro de Investigación Informática Lazarus

DeepMind-MuZero

Grupo DeepMind ,Creadores de MuZero, Programa de Inteligencia Artificial de Google . La Skynet del Futuro?

El grupo de DeepMind, desarrolladores de IA de Google, creó a MuZero un programa informático diseñado para dominar juegos sin conocer sus reglas. La Inteligencia Artificial IA, cada vez nos sorprende más, desde casas y ciudades que serán controladas por ellas directamente, y ahora nos anuncian que MuZero consiguió el hito de ser una maestra de juegos como ajedrez, shogi, e incluso juegos de Atari. La base de la IA, es anticipar el futuro e ir más allá de éste, va aprendiendo de sus errores y avanza.

MuZero utiliza un algoritmo de enfoque similar al de AlphaZero, y fue entrenado a través del juego automático, al enfrentarse contra AlphaZero fue sin acceso a reglas, tablas de finales o libros de aperturas. Coincidieron en el rendimiento de Ajedrez y Shogi, pero mejoró en Go (Batiendo un record mundial), también mejoró en el dominio de un conjunto de 57 juegos de Atari, un dominio visualmente complejo. Esta noticia nos sorprende como las IA actuales ya que son capaces de mirar más allá, y desarrollarse solas.

Otras IA de DeepMind ya habían vencido a campeones mundiales en juegos como el milenario Go e incluso en videojuegos como el famoso Starcraft II, pero en estos casos ya conocía todas sus reglas y parámetros, MuZero las aprende por su cuenta. (MZ) emplea una nueva táctica de aprendizaje llamada: búsqueda mirando al futuro, según Nature vía TechXplore.


¿Cómo funciona MuZero?

MuZero estudia una serie de comandos o movimientos en función de su adversario (jugador contrario de un partido de Shogi o un enemigo incluso como en un juego de Atari), analizando las jugadas de los otros y aprende qué está permitido y qué no. Si hace un movimiento erróneo lo tacha de malo, y si acierta lo tacha como válido. Así intuitivamente, MuZero inventa sus reglas o dinámicas internamente y esto conduce a una planificación precisa. Va perdiendo en principio, pero luego se vuelve experta y es capaz de batir records contra jugadores profesionales de ajedrez y de Pacman.

Como explican expertos de DeepMind, MuZero utiliza el aprendizaje por refuerzo, en el que las recompensas llevan al agente de IA a cumplir sus objetivos, involucra modelos y de esta forma modela un entorno dado como un paso intermedio, lo cual es muy parecido al cerebro humano. Una de las críticas a estos expertos, es que no se están esforzando mucho en pensar las consecuencias negativas que pueda traer este tipo de IA. Se debe poner énfasis en que los algoritmos sean en beneficio de la sociedad.

Te invitamos a nuestra comunidad en Telegram
https://t.me/LAZARUS_VENEZUELA

Deja una respuesta

¿Conoces el Grupo Lazarus?

× ¿Cómo puedo ayudarte?