Tech
Lectura 1 - 2 minutos
Google presenta Gemini 2.5 Computer Use: la IA que navega e interactúa por ti
TXT Luis Miranda

Google presenta Gemini 2.5 Computer Use: la IA que navega e interactúa por ti

Fotógraf@/ Gemini
  • Like
  • Comentar

Google ha lanzado la vista preliminar de Gemini 2.5 Computer Use, un nuevo modelo de inteligencia artificial capaz de navegar páginas web, rellenar formularios y ejecutar tareas en línea de manera autónoma, simulando la interacción humana con clics, escritura y desplazamientos en la interfaz.

Basado en Gemini 2.5 Pro, este sistema impulsa proyectos como Project Mariner y está disponible para desarrolladores a través de la API de Gemini en Google AI Studio y Vertex AI.

El objetivo es que los agentes de IA puedan realizar tareas directamente sobre interfaces gráficas sin necesidad de programación avanzada, lo que abre la posibilidad de delegar procesos como hacer reservas en línea, buscar información o registrarse en plataformas.

El funcionamiento de Gemini 2.5 Computer Use se apoya en tres elementos: la instrucción del usuario, una captura de pantalla del entorno y el historial de acciones recientes.

Con estos datos, el modelo analiza el contexto visual y determina qué acción ejecutar, ya sea hacer clic en un botón, escribir en un campo o mover elementos en pantalla.

En casos sensibles —como enviar datos o realizar compras—, solicita la confirmación del usuario, mientras que un sistema de seguridad externo supervisa cada acción para prevenir usos indebidos.

Google mostró ejemplos de su desempeño en pruebas reales: desde gestionar citas en un spa para mascotas navegando y llenando formularios, hasta organizar un tablero físico de post-its mediante la clasificación y reordenamiento digital de notas.

 

Aunque todavía no puede controlar sistemas operativos de escritorio, la compañía anticipa que futuras versiones ampliarán sus capacidades, aunque podrían enfrentar limitaciones en regiones como Europa por cuestiones de privacidad y seguridad.

Con este avance, Google busca consolidar el desarrollo de agentes de propósito general, capaces de interactuar con entornos digitales de forma autónoma y más cercana a la manera en que lo haría una persona. Sin embargo, al tratarse de una versión preliminar, la compañía advierte que podrían presentarse errores mientras se ajusta el modelo.

Inicia sesión y comenta
Ant. Salesforce invertirá 1,000 mdd en México para impulsar la inteligencia artificial y abrir un nuevo centro global

Hay 10724 invitados y ningún miembro en línea

Publish modules to the "offcanvas" position.