Una nueva filtración sobre Google Gemini sacude la conversación en torno a la IA agentiva. El leak, publicado por el investigador y analista @chetaslua, revela un conjunto de modos avanzados que delinean con claridad la hoja de ruta de Google para convertir sus modelos en agentes autónomos multimodales, proactivos e inmersivos.
Y lo más importante: no se trata solo de prompts, sino de capacidades estructuradas para ejecutar acciones reales, con autonomía y contexto.
🔹 Modos de Tarea (Task Modes)
Estos modos activan comportamientos específicos que permiten a Gemini funcionar como un agente operativo:
- AGENTIC_TASK
Agentes autónomos que planifican y ejecutan flujos de trabajo de forma independiente. - DUPLEX_TALK_TO_AGENT
Automatización de llamadas de voz para tareas como reservas o confirmaciones. - DUPLEX_TRIGGER_AND_POLL
Capacidad de lanzar procesos largos y hacer seguimiento automático con polling.
🌀 Modos Inmersivos (Immersive Modes)
Aquí es donde la experiencia se vuelve realmente multifacética y proactiva:
- DEEP_RESEARCH_IMMERSIVE
Para investigaciones extensas y automatizadas sobre un tema. Ideal para estudiantes, periodistas o estrategas. - AGENTIC_BUNDLE_IMMERSIVE
Agrupa tareas complejas y las convierte en una experiencia fluida e interconectada. - STUDIO_CREATE
Modo creativo que permite generar:
▫️ Presentaciones
▫️ Quizzes
▫️ Flashcards
▫️ Timelines
▫️ Mapas mentales
▫️ Dashboards de datos
🧠 ¿Qué significa todo esto?
Estamos frente a una nueva fase en la evolución de los LLMs: la autonomía agentiva por diseño. Ya no hablamos solo de generación de texto, sino de modelos que piensan, actúan y estructuran conocimiento de forma contextualizada, multimodal y útil.
Desde Sombra Radio seguiremos atentos a la evolución de Gemini y de esta nueva generación de IA agentiva. Lo que antes eran plugins, ahora se perfila como el núcleo del nuevo paradigma de uso.