Tech
Lectura 1 - 2 minutos
Anthropic escaneó y destruyó millones de libros para entrenar su IA Claude
TXT Genbeta

Anthropic escaneó y destruyó millones de libros para entrenar su IA Claude

  • Like
  • Comentar

La empresa de inteligencia artificial Anthropic, creadora del modelo Claude, entrenó su sistema utilizando millones de libros impresos que fueron comprados, escaneados y luego destruidos, según documentos judiciales recientemente revelados. Esta inusual estrategia se llevó a cabo con la asesoría de Tom Turvey, exdirectivo de Google Books, contratado en 2024 con un encargo claro: conseguir "todos los libros del mundo".

¿Cómo lo hicieron?
Anthropic compró legalmente millones de libros físicos, los desencuadernó y escaneó uno por uno para convertirlos en archivos digitales. Una vez digitalizados, los ejemplares fueron desechados, a diferencia de iniciativas anteriores como la de Google Books, que trabajaba con préstamos de bibliotecas y devolvía los libros tras su escaneo.

La intención era clara: crear un corpus de entrenamiento extenso y legalmente más seguro para su inteligencia artificial. Esto surgió luego de que la empresa reconociera los riesgos legales de usar versiones digitales de libros sin licencia, una práctica que había seguido en etapas previas.

¿Es legal?
El juez William Alsup determinó que el uso fue legal bajo el criterio de uso legítimo (fair use), dado que Anthropic compró los libros, no distribuyó el contenido digitalizado y usó los textos internamente para desarrollar su modelo de lenguaje.

¿Por qué importa?
Este caso refleja cómo las grandes compañías de IA están dispuestas a invertir millones y destruir material físico con tal de obtener datos de entrenamiento de alta calidad. También reaviva el debate sobre el uso de obras protegidas por derechos de autor para entrenar modelos de inteligencia artificial, especialmente cuando los autores no han sido consultados ni compensados.

La estrategia de Anthropic pone sobre la mesa preguntas éticas y legales sobre el futuro del conocimiento, el acceso a la información y el equilibrio entre innovación tecnológica y derechos de autor.

Inicia sesión y comenta
Ant. Estafadores usan la popularidad de los labubu para robar datos
Sig. Amazon supera el millón de robots en almacenes y avanza hacia una logística dominada por la IA

Hay 5880 invitados y ningún miembro en línea

Publish modules to the "offcanvas" position.