Tecnolog.IA

Google lanza una IA que usa el navegador como un humano

Tomado de: theverge.com

Google presentó un modelo de inteligencia artificial llamado Gemini 2.5 Computer Use, capaz de hacer clic, desplazarse, escribir e interactuar dentro de un navegador web para acceder a información que no está disponible mediante API.

La idea es que el modelo actúe sobre las interfaces web tal como lo haría un usuario humano, completando tareas como llenar formularios, navegar por sitios o buscar datos en plataformas que no tienen integraciones programáticas.

A diferencia de otros agentes de IA que pueden controlar todo el sistema operativo, Gemini 2.5 se limita exclusivamente al navegador, lo que mejora la seguridad y mantiene el foco en tareas dentro del entorno web.

Google asegura que el modelo supera a las alternativas líderes en pruebas de rendimiento web y móviles. Ya está disponible para desarrolladores a través de Google AI Studio y Vertex AI, y también cuenta con una demostración pública donde puede verse realizando acciones como "jugar videojuegos de 2048 o explorar debates en línea".

 

Actualmente, el sistema puede ejecutar 13 tipos de acciones predefinidas dentro del navegador, como abrir pestañas, arrastrar elementos o escribir texto. Sin embargo, no está diseñado para controlar directamente funciones del sistema operativo.

Artículos relacionados

Puede ser que te guste