La Fundación Wikimedia, responsable de Wikipedia y otros proyectos como Wikilibros y Wikcionario, ha encendido las alertas por el creciente impacto de los bots de inteligencia artificial que consumen masivamente sus contenidos. Según un comunicado reciente, el aumento del tráfico provocado por rastreadores automáticos ha sobrecargado sus servidores, generando interrupciones y ralentización en el servicio, especialmente durante eventos de alta demanda informativa.
El problema radica en que los grandes modelos de lenguaje (LLM), utilizados por chatbots y sistemas de IA generativa, requieren una cantidad masiva de datos humanos para su entrenamiento. Para obtenerlos, muchos bots extraen información directamente desde sitios abiertos como Wikipedia, sin control ni colaboración con los administradores de estas plataformas. Aunque solo el 35% de las visitas a Wikipedia provienen de bots, estos generan el 65% del tráfico más costoso en términos de recursos.
Este consumo desmedido afecta no solo la infraestructura técnica de Wikimedia, sino también su comunidad de voluntarios, quienes son responsables de crear y revisar el contenido gratuito que se usa para alimentar modelos de IA. El riesgo, advierten desde la fundación, es que este modelo no solo encarece el mantenimiento del sitio, sino que también reduce la visibilidad y participación de usuarios reales.
Birgit Mueller, directora de producto de Wikimedia, explicó que si bien la fundación está abierta a que empresas tecnológicas usen su contenido, pide que lo hagan de manera responsable: atribuyendo correctamente la fuente, incentivando el tráfico directo a sus páginas y evitando el uso masivo que comprometa la sostenibilidad del proyecto.
Más allá del aspecto técnico, esta situación plantea un dilema mayor: el desplazamiento del usuario humano en la navegación web. A medida que asistentes virtuales responden preguntas sin necesidad de visitar los sitios originales, proyectos como Wikipedia enfrentan un nuevo reto existencial en un internet cada vez más automatizado.
Wikimedia insiste en que el contenido generado y verificado por personas sigue siendo esencial para garantizar información precisa y confiable. Por ello, hacen un llamado a las empresas de inteligencia artificial a apoyar la continuidad de los espacios abiertos que hoy sostienen gran parte del conocimiento en línea.