Fotomontaje inspirado en Gemini Live
Gemini Live cambia para siempre con el 'modo razonamiento' y todas estas innovaciones experimentales
El modo de voz avanzado de Gemini se actualizará con Gemini 3 Pro y Razonamiento para dar paso a nuevas experiencias en la conversación natural.
Más información: Gemini Live estrenaría un botón inspirado en ChatGPT que evita que la IA de Google pierda el hilo de la conversación
Gemini Live se actualizó en Android en octubre para mejorar la conversación natural que ofrece la IA de Google, y ahora está a punto de recibir una serie de mejoras que elevarán su experiencia.
El modo de voz avanzado de Gemini actualmente utiliza el modelo Gemini 2.5 Flash y con la llegada de Gemini 3 Pro en noviembre, según 9to5Google, Google introdujo funciones de "Labs" como Gemini Agent, Dynamic View y Visual Layout.
Labs permite al usuario probar de antemano una serie de novedades que llegarían a la app de Gemini en Android. Lo peculiar es que la versión 17.2 de la app de Google revela cuatro nuevas capacidades.
La primera es "Live Thinking Mode", que sigue el hilo de esta funcionalidad en el chatbot de texto de Gemini, para que Gemini Live se tome más tiempo en responder con su voz y así dé respuestas más detalladas.
Labs también introducirá otras funciones experimentales como memoria multimodal, mejor gestión del ruido, "responder cuando vea" o "identifique" algo, y resultados personalizados según las apps de Google.
Pero lo más importante es que, si Live actualmente está potenciado por Gemini 2.5 Flash, Labs revela que Gemini Live se actualizará a Gemini 3.
Un dato importante, teniendo en cuenta que Gemini 3 ha sido un gran salto hacia adelante en la experiencia de la IA de Google y por haber sido capaz de reducir la distancia en la cuota de mercado que compite contra ChatGPT.
Imagen de Gemini Live
Cabe recordar que cuando OpenAI presentó hace casi dos años el modelo de voz avanzado, parecía que estábamos ante un momento tecnológico disruptivo, aunque no ha impactado tanto como se esperaba.
Que Live Thinking Mode pudiera utilizar tanto el modelo Pro como el de Razonamiento para dar respuestas más detalladas mejoraría la conversación natural de Gemini para recortar distancias con la de ChatGPT.
Sobre las nuevas funciones experimentales de Live, ya están disponibles en la experiencia de chat con Gemini 3 Flash y Pro, y se incluyen las apps conectadas a Personal Intelligence y el historial de conversaciones.
Una mejor gestión de cancelación de ruido siempre es necesaria, mientras que "responder cuando ve algo" parece más bien una habilidad que proviene de Project Astra (iniciativa de Google DeepMind para crear un agente de IA universal).
El resto de funciones de Labs son Control UI, para que un agente controle el móvil para completar tareas, y Deep Research, para delegar tareas de investigación complejas.
Esta última función estaría más bien relacionada con el Agente Gemini que llegaría a Android como parte de Computer Use, el modelo de IA especializado en la interacción con interfaces de usuario, navegadores y sitios web.