Ciencia
Lectura 2 - 3 minutos
La IA se autoenseña y supera a los algoritmos diseñados por humanos

La IA se autoenseña y supera a los algoritmos diseñados por humanos

La IA se autoenseña y supera a los algoritmos diseñados por humanos
  • Like
  • Comentar

El presente artículo, compartido por un estimado colega, fue escrito por Paul Arnold, editado por Gaby Clark, revisado por Robert Egan y publicado el 23 de octubre de 2025 en Phys.org. El texto fue traducido, editado y adaptado con apoyo de ChatGPT-5 para este espacio. Veamos de qué trata…

Al igual que los humanos, la inteligencia artificial (IA) aprende mediante ensayo y error, aunque tradicionalmente depende de que los humanos definan los algoritmos y las reglas que guían ese aprendizaje. Sin embargo, a medida que la tecnología avanza, las máquinas comienzan a actuar de forma cada vez más autónoma. Un ejemplo notable es un nuevo sistema de IA desarrollado por investigadores que inventó su propio método de aprendizaje, logrando crear un algoritmo que superó a los diseñados por humanos en diversas tareas complejas.

Durante décadas, los ingenieros han sido quienes diseñan los algoritmos que utilizan los agentes de IA para aprender, especialmente en el campo del aprendizaje por refuerzo (AR), en el que un sistema mejora su desempeño a través de recompensas obtenidas por acciones exitosas. Mientras que el aprendizaje es algo natural para los seres humanos y los animales —resultado de millones de años de evolución—, la IA debe ser instruida explícitamente, en un proceso que suele ser lento, laborioso y limitado por la intuición humana.

Inspirándose en la evolución biológica, los investigadores crearon una población digital de agentes de IA que intentaron resolver numerosas tareas en entornos complejos utilizando una regla de aprendizaje inicial. Este proceso fue supervisado por una metarred, una “IA madre” encargada de analizar el rendimiento de los agentes y modificar sus reglas de aprendizaje para que las generaciones siguientes aprendieran con mayor rapidez y eficacia.

Gracias a este mecanismo, el sistema descubrió una nueva regla de aprendizaje denominada DiscoRL, cuya versión más avanzada, Disco57 (por haber sido evaluada en 57 juegos de Atari), superó a todas las reglas de aprendizaje diseñadas por humanos hasta la fecha.

El equipo utilizó Disco57 para entrenar un nuevo agente de IA y comparó su desempeño con algunos de los algoritmos más reconocidos, como PPO y MuZero. Tras ser entrenado con juegos clásicos de Atari y posteriormente con entornos inéditos —como ProcGen, Crafter y NetHack—, los resultados fueron sorprendentes.

 

En el Atari Benchmark, un conjunto de videojuegos clásicos utilizado para evaluar el rendimiento de la IA, el agente entrenado con DiscoRL obtuvo puntajes superiores a todos los algoritmos diseñados por humanos. Además, al enfrentarse a desafíos no previstos, mostró un desempeño de vanguardia, evidenciando que el sistema había descubierto de manera autónoma su propia regla de aprendizaje.

“Nuestros hallazgos sugieren que los algoritmos de aprendizaje por refuerzo necesarios para una inteligencia artificial avanzada podrían pronto descubrirse automáticamente a partir de las experiencias de los agentes, en lugar de ser diseñados manualmente”, escriben los investigadores en su artículo publicado en Nature. “Este trabajo representa un paso hacia algoritmos de aprendizaje por refuerzo diseñados por máquinas, capaces de competir e incluso superar a algunos de los mejores algoritmos creados por humanos en entornos complejos.”

Fuente: https://techxplore.com/news/2025-10-ai-outperforms-human-algorithms.html

Inicia sesión y comenta
Ant. Descubren fósiles de perezoso gigante en Yucatán
Sig. Descubren en Marte las moléculas orgánicas más grandes halladas hasta ahora

Hay 8514 invitados y ningún miembro en línea

Publish modules to the "offcanvas" position.