Gemini 2.5: la nueva IA de Google que usa la computadora como una persona

Gemini 2.5 de Google puede operar plataformas digitales, ejecutar tareas y razonar como un usuario real.

Google presentó Gemini 2.5, una versión mejorada de su modelo de inteligencia artificial capaz de interactuar con interfaces digitales como un humano. Gracias a su razonamiento visual y su ejecución iterativa, el sistema puede operar plataformas, completar formularios y organizar tareas de forma autónoma.

El modelo ya está disponible para desarrolladores en vista previa pública a través de la API de Gemini en Google AI Studio y Vertex AI.

Google presentó la versión final de sus modelos de inteligencia artificial Gemini 2.5 Pro y Flash

Un modelo que actúa y razona como un usuario humano

A diferencia de los sistemas tradicionales, que dependen de APIs estructuradas, Gemini 2.5 puede manipular interfaces gráficas directamente. Esto incluye escribir, hacer clic, desplazarse, usar menús desplegables o navegar entre páginas, incluso dentro de plataformas que requieren inicio de sesión.

Completa y envía formularios online.
Navega por sitios web o plataformas colaborativas.
Clasifica, mueve y organiza elementos según instrucciones del usuario.

Por ejemplo, el sistema puede ordenar notas en un tablero de tareas digital siguiendo indicaciones precisas.

Cómo funciona el modelo Gemini 2.5

El modelo opera mediante la herramienta computer_use incluida en la API de Gemini. Funciona en un ciclo iterativo: el usuario envía una solicitud junto con una captura de pantalla y el historial de acciones recientes. Gemini analiza esos datos, genera una respuesta y ejecuta una acción (como hacer clic o escribir).

Google Gemini es una herramienta poderosa, pero no está diseñada para manejar ciertos tipos de datos

Tras cada acción, el sistema recibe una nueva captura del entorno y repite el proceso hasta completar la tarea o recibir una orden de detención. Este método permite mantener interacciones seguras y controladas con el entorno digital.

Rendimiento y seguridad de la plataforma

De acuerdo con Google, el modelo superó a las principales alternativas en pruebas de control web y móvil, mostrando menor latencia y mayor precisión. Aunque está optimizado para navegadores, también mostró resultados prometedores en otras interfaces.

Seguridad y confiabilidad en la información

En materia de seguridad, Google implementó múltiples capas de protección. Entre ellas, un sistema de verificación paso a paso que evalúa cada acción antes de ejecutarla, como compras o accesos a datos personales.

Disponibilidad del nuevo modelo de Google

Desde el 7 de octubre, Gemini 2.5 está disponible para prueba en Google AI Studio y Vertex AI. Además, los desarrolladores pueden experimentar con el modelo en un entorno de demostración alojado por Browserbase o crear su propio entorno con herramientas como Playwright.

Noticias relacionadas

Claude Opus 4.7: la IA de Anthropic que trabaja casi sin supervisión

Rutas a la costa: así será el nuevo sistema de peajes sin barreras

El enojo de Darío Barassi con El Trece por los cambios en su programa

PRAGMATA se mete entre los juegos mejor valorados de Capcom en Steam

THQ Nordic prepara 7 juegos secretos para la Nintendo Switch 2

Despilfarro vs inversión: el contraste entre la gira de Kicillof y los viajes de Milei

Gemini 2.5: la nueva IA de Google que usa la computadora como una persona

La IA de Google que actúa como un humano: así funciona el nuevo Gemini 2.5

Gemini 2.5 de Google puede operar plataformas digitales, ejecutar tareas y razonar como un usuario real.

El modelo ya está disponible para desarrolladores en vista previa pública a través de la API de Gemini en Google AI Studio y Vertex AI.

Un modelo que actúa y razona como un usuario humano

Completa y envía formularios online.
Navega por sitios web o plataformas colaborativas.
Clasifica, mueve y organiza elementos según instrucciones del usuario.

Por ejemplo, el sistema puede ordenar notas en un tablero de tareas digital siguiendo indicaciones precisas.