Google ha presentado importantes mejoras en su modelo de inteligencia artificial más avanzado, Gemini 2.5, durante su evento anual de desarrolladores. Entre las principales novedades se encuentra la posibilidad de cambiar de tono de voz e idioma en tiempo real, gracias a la nueva función 'Native audio output', que admite dos voces distintas.
Este avance busca ofrecer una experiencia más personalizada, natural y útil tanto para usuarios como para desarrolladores, especialmente en contextos multilingües o que requieren diferentes estilos de comunicación.
Dos nuevas versiones de Gemini 2.5
Google también lanzó dos variantes del modelo:
Gemini 2.5 Pro: pensada para tareas complejas. Incorpora un modo de “pensamiento profundo”, que analiza diferentes hipótesis antes de responder.
Gemini 2.5 Flash: más rápido y accesible, ideal para aplicaciones que requieren eficiencia. Mejora en programación, razonamiento y procesamiento de texto más largo.
Ambos modelos estarán disponibles en vista previa desde julio en AI Studio, Vertex AI y Gemini API.
Herramientas para desarrolladores
Para facilitar el uso de Gemini, Google introdujo:
Thinking Budgets: permite controlar el uso de tokens.
Thoughts (función experimental): muestra el proceso lógico detrás de cada respuesta, haciendo más transparente el funcionamiento del modelo.
Más novedades en IA
Además de Gemini, Google mostró avances en otros proyectos de IA como:
Gemini Diffusion: permitirá mayor control y creatividad en la generación de texto.
World Models: simulan el mundo real para mejorar el desarrollo en robótica.
Con estas actualizaciones, Google refuerza su apuesta por una IA más poderosa, personalizable y accesible, marcando un paso firme en la competencia con otras grandes tecnológicas del sector.