Google presenta Gemini 2.5 Computer Use: la IA que navega e interactúa por ti

Tech

Lectura 1 - 2 minutos

TXT Luis Miranda Miércoles, 8 Octubre

Google presenta Gemini 2.5 Computer Use: la IA que navega e interactúa por ti

@UnionDeMorelos

Fotógraf@/ Gemini

- 5
Like
Comentar

Google ha lanzado la vista preliminar de Gemini 2.5 Computer Use, un nuevo modelo de inteligencia artificial capaz de navegar páginas web, rellenar formularios y ejecutar tareas en línea de manera autónoma, simulando la interacción humana con clics, escritura y desplazamientos en la interfaz.

Basado en Gemini 2.5 Pro, este sistema impulsa proyectos como Project Mariner y está disponible para desarrolladores a través de la API de Gemini en Google AI Studio y Vertex AI.

El objetivo es que los agentes de IA puedan realizar tareas directamente sobre interfaces gráficas sin necesidad de programación avanzada, lo que abre la posibilidad de delegar procesos como hacer reservas en línea, buscar información o registrarse en plataformas.

El funcionamiento de Gemini 2.5 Computer Use se apoya en tres elementos: la instrucción del usuario, una captura de pantalla del entorno y el historial de acciones recientes.

Con estos datos, el modelo analiza el contexto visual y determina qué acción ejecutar, ya sea hacer clic en un botón, escribir en un campo o mover elementos en pantalla.

En casos sensibles —como enviar datos o realizar compras—, solicita la confirmación del usuario, mientras que un sistema de seguridad externo supervisa cada acción para prevenir usos indebidos.

Google mostró ejemplos de su desempeño en pruebas reales: desde gestionar citas en un spa para mascotas navegando y llenando formularios, hasta organizar un tablero físico de post-its mediante la clasificación y reordenamiento digital de notas.

Aunque todavía no puede controlar sistemas operativos de escritorio, la compañía anticipa que futuras versiones ampliarán sus capacidades, aunque podrían enfrentar limitaciones en regiones como Europa por cuestiones de privacidad y seguridad.

Con este avance, Google busca consolidar el desarrollo de agentes de propósito general, capaces de interactuar con entornos digitales de forma autónoma y más cercana a la manera en que lo haría una persona. Sin embargo, al tratarse de una versión preliminar, la compañía advierte que podrían presentarse errores mientras se ajusta el modelo.

Visto 2562 veces

@UnionDeMorelos
Gemini

Tech
Gemini

Inicia sesión y comenta

Ant. Salesforce invertirá 1,000 mdd en México para impulsar la inteligencia artificial y abrir un nuevo centro global

Sig. AMD y Sony revelan nuevas tecnologías para el futuro de los videojuegos: La PS6 tendrá IA

What Are You Looking For?

Popular Tags

Google presenta Gemini 2.5 Computer Use: la IA que navega e interactúa por ti