Angela Sun, director of multimodal platforms, Gemini App Chema Flores Omicrono

Tecnología ENTREVISTA

Angela Sun, la directiva de Google tras el éxito de Gemini: "La visión es hacer un asistente que esté realmente contigo"

Google ha revolucionado todos sus productos usando su sistema de IA, Gemini, que propone una nueva forma de usar la tecnología.

Más información: Sameer Samat (Android): "Hemos integrado muy bien la IA; no hay un mejor momento para probar Android que ahora”

Chema Flores

Mountain View (EE.UU.)

Publicada 7 junio 2025 02:40h

Google ha presentado un centenar de novedades durante Google I/O. De un sistema de videollamadas ultrarrealista a un cambio radical del buscador, así como sus gafas inteligentes o un enorme avance de generación de imagen. Todo bajo un elemento vertebrador: Gemini.

Durante la conferencia de desarrolladores, el sistema de inteligencia artificial de la compañía recibió una importante actualización de capacidades con los modelos Gemini 2.5 Flash y Pro, buscando que las empresas puedan crear aplicaciones y agentes impulsados por IA más sofisticados y seguros.

A nivel de usuario, la aplicación de Gemini también ha experimentado un impulso extraordinario con nuevas capacidades, que ahora va a más. A mucho más.

Gemini llega a televisores, Wear OS y Android Auto

Android se renueva a lo grande con Gemini como pilar central: la IA de Google se extiende a Android Auto y a Wear OS

En concreto, ha llegado una expansión de Gemini Live, la mejora de Imagen 4 y Veo 3, actualizaciones de Deep Research y Canvas, la llegada a Chrome, plan para estudiantes, el plan Google AI Ultra así como 2.5 Flash como nuevo modelo predeterminado.

Una de las responsables tras esta enorme evolución de la inteligencia artificial de Google es Angela Sun, directora de plataformas multimodales de Gemini App.

En EL ESPAÑOL - Omicrono hablamos con ella poco después de que haya concluido la presentación inaugural de Google I/O. Nos reunimos a escasos metros del Anfiteatro Shoreline de Mountain View, donde hace escasos minutos se han producido un aluvión de anuncios.

La directiva llega apurada, propio del ajetreo del momento. Se muestra cercana, pletórica y entusiasmada. Consciente del músculo que demuestra Google y el golpe que acaba de dar en el campo de la inteligencia artificial.

Gemini es clave para la compañía. Es más personal, más proactivo y más potente. ¿Cuál es la ambición de Google con su modelo de inteligencia artificial?

Los tres principios que mencionaste son nuestra guía para convertirlo en un asistente verdaderamente universal que te acompañe, que sea indispensable a diario para ayudarte. Muchos de los casos de uso se refieren a la navegación, donde necesitas ir a la identificación de ciertas cosas.

La visión es hacer de Gemini un asistente realmente universal que esté contigo y te ayude en el camino.

Gafas inteligentes de Google con Android XR

Probamos las gafas inteligentes de Google: el fin del smartphone como lo conoces está más cerca, y este es el primer gran golpe

Se han mostrado funciones realmente potentes y útiles, ¿hasta dónde será capaz de llegar Gemini?

Lo bonito del asistente universal es hacerlo tangible para los usuarios habituales.

En Google I/O nos ha encantado ver todas cosas geniales que puede hacer —y muchos términos técnicos—, pero para realmente imaginar todo lo que el asistente universal puede hacer, no solo en los diferentes factores (reloj, gafas, teléfono, portátil…), sino realmente en cómo puede ayudarte todos los días.

Mientras trabajamos a diario en este producto pensamos en las funciones del asistente que te pueden ayudar a diario, que te sirvan para organizar tu vida. Por ejemplo, imaginamos un mundo donde esté integrado en aplicaciones de Google como el calendario, pudiendo administrar y gestionar tus citas.

O también pensamos mucho en la colaboración y la creatividad. Queremos convertir a los soñadores en creadores y ya es tan simple como dar una indicación en un prompt.

Son solo algunos de los casos de uso y las cosas que imaginamos sobre cómo Gemini puede ayudarte en tu día a día.

Presentación de Gemini en Google I/O Google

Hablando de generación de imágenes, hemos visto un enorme salto tanto en ilustraciones como en vídeo, en muy pocos meses ¿cuál es la ambición de Google en el desarrollo de estas herramientas?

Creo que tanto las imágenes como el video que hemos mostrado en los anuncios son muy importantes para nosotros. Uno de los cambios más importantes que hemos hecho en Imagen 4 es el poder poner texto con fidelidad en la imagen, así como usar tipografías.

Este es uno de esos productos que estimula la creatividad. Tengo dos hijos de cinco y siete años con los que lo uso a diario y realmente les despierta la imaginación. Soy de esas personas que convierten los dibujos de sus hijos en imágenes fotorrealistas en 3D, es una forma genial de transformar lo que dibujan en papel 2D a una imagen tridimensional.

Estos modelos tan poderosos que evolucionan tanto en unos pocos meses, realmente expanden los límites de la imaginación.

"Estos modelos de imagen y vídeo tan poderosos, que evolucionan tanto en unos pocos meses, realmente expanden los límites de la imaginación"

¿Cuál es el próximo reto de la generación de imágenes?

Creo que en nuestra próxima fase realmente buscamos mejorar siempre la calidad visual, la representación del texto y el seguimiento de instrucciones de los prompts. Esas seguirán siendo las mejoras que realizaremos en el futuro.

Uno de los anuncios con más impacto ha sido Veo 3. Hace que la generación de vídeo se vea más avanzada que nunca —incluyendo ahora sonidos—, ¿será posible diferenciar cuándo un video se crea con IA a cuándo sea real? ¿está trabajando Google en ello?

Nuestros principios de IA se basan en ser audaces y responsables. Siempre queremos superar las fronteras de la investigación, como han visto con Veo 3 y otros anuncios, pero lo hacemos con responsabilidad. Por eso, siempre trabajamos en equipo y realizamos pruebas internas exhaustivas.

Sobre la diferenciación entre generación y realidad, disponemos de SynthID, una marca de agua invisible que está en todos los artefactos que se generan y siempre se puede detectar y comprender lo que se ha generado mediante la IA.

Así es Veo 3 de Google

Otro de los lugares donde ahora llega Gemini es en Chrome y en las búsquedas, ¿cómo cree que puede cambiar algo tan cotidiano y que usamos a diario?

Absolutamente, con estas nuevas herramientas impulsadas por IA los usuarios ya están cambiando su forma de buscar. Combinamos desde las indicaciones muy breves, que mucha gente todavía utiliza, hasta indicaciones mucho más largas y profundas que realmente pueden ayudar a obtener resultados mucho más completos para alcanzar los objetivos de búsqueda de los usuarios.

"Estas nuevas herramientas impulsadas por IA los usuarios ya están cambiando su forma de buscar"

Una de las opciones de búsqueda más impresionantes es Gemini Live, hemos visto una demo para hablar con el asistente como un colega, ¿cuál es el camino para hacer que este sistema llegue al gran público?

Gemini Live ya está disponible en todo el mundo y muchas de las funciones que han podido ver, especialmente las de cámara y el uso compartido de pantalla, ya están disponibles de forma gratuita en Android e iOS.

Quizá más personal; ¿qué característica le entusiasma más de incorporar a Gemini?

Es una pregunta fantástica. En realidad, se trata de los tres principios que hablábamos, ¿verdad? Personal, proactivo y poderoso. Por eso creo que mucho de lo que veo hoy en día, y lo que me entusiasma, es ese asistente universal que puede actuar contigo y en tu nombre.

Mucho de lo que ven en términos del Project Mariner y su capacidad de actuar en su nombre con su orientación y realmente convertirlo en un asistente útil para la vida diaria es lo que realmente me entusiasma.

"Creo que el mayor desafío para un uso generalizado de la IA es que el aprendizaje y la iteración sean rápidos"

¿Cuál es el mayor reto para llevar la IA a un uso generalizado?

Honestamente, creo que el mayor desafío es que el aprendizaje y la iteración sean rápidos. A veces, se ven muchos prototipos, incluso el más reciente —que fue la traducción simultánea— que es como: "bueno, esto es arriesgado, lo estamos haciendo en vivo en el escenario”.

Pero ves que el verdadero desafío es comprender cómo usan los usuarios la tecnología y asegurarnos de poder capturar esos aprendizajes e iterar rápidamente para desarrollar productos que realmente les encanten.

La última pregunta, ¿cómo ve a Gemini en tres años? Tenemos un desarrollo muy rápido.

Sí, creo que la velocidad con la que estos modelos están adquiriendo inteligencia es realmente asombrosa. Así que, para mí, la clave está en cómo liberar ese potencial.

Creo que tenemos muchísimas y poderosas interacciones cada pocos meses que realmente me impresionan. Así que creo que para mí es clave conectar las tres P (personal, potente y proactivo) para poder aprovechar ese poder y liberarlo de maneras que sean personales, proactivas y útiles para ti. Es hacia donde imagino que se dirige Gemini.

Más en Tecnología