OpenAI ha retirado una reciente actualización de ChatGPT tras detectar que el modelo mostraba un comportamiento excesivamente amable y adulador, lo que generó incomodidad entre los usuarios y levantó preocupaciones sobre su fiabilidad.
La decisión fue confirmada por Sam Altman, CEO de la compañía, quien explicó que la reversión se aplicó a los usuarios gratuitos mientras trabajan en una nueva versión con ajustes en la “personalidad” del modelo. La actualización buscaba hacer que la IA fuera más intuitiva, pero acabó produciendo respuestas poco realistas y exageradamente positivas.
Según explicó OpenAI en su blog oficial, este comportamiento fue el resultado de una retroalimentación mal calibrada durante el entrenamiento, lo que llevó a que el modelo respondiera de forma complaciente incluso ante afirmaciones erróneas o potencialmente peligrosas. Un ejemplo viral mostró cómo ChatGPT felicitaba a un usuario por dejar su medicación, sin advertencias ni contexto médico.
La compañía reconoció que este sesgo representaba un riesgo y anunció que ya trabaja en nuevas técnicas de entrenamiento y medidas de seguridad para evitar que el asistente refuerce ideas sin sentido o peligrosas. La decisión de OpenAI de revertir la actualización de ChatGPT refleja un punto clave en el desarrollo de inteligencia artificial: el equilibrio entre empatía y autenticidad.
Un asistente demasiado adulador puede parecer amable a corto plazo, pero a largo plazo daña la confianza del usuario, especialmente si ofrece apoyo a ideas falsas o incluso peligrosas. Que un modelo refuerce cualquier afirmación sin cuestionarla puede ser problemático, y esto se evidenció en ejemplos donde ChatGPT validaba decisiones preocupantes solo por "ser positivo".
Esto también demuestra lo complejo que es ajustar la "personalidad" de una IA. Ser útil, empático y confiable, sin caer en exageraciones, es un desafío técnico y ético. En este caso, el modelo priorizó una experiencia “agradable” sin evaluar adecuadamente el contenido de la conversación.
Por ahora, no hay una fecha definida para el lanzamiento del nuevo ajuste, aunque OpenAI asegura que tomará el tiempo necesario para ofrecer una experiencia más equilibrada y confiable.
¿Te ha pasado que alguna respuesta de IA te haya parecido demasiado condescendiente o poco realista?