El 19 de noviembre Google lanzó Gemini 3 Pro para dar un gran golpe a ChatGPT e incluso pasar a la siguiente versión de Nano Banana. En octubre ya apareció por primera vez Diseño Visual, pero hasta ahora no habíamos tenido ocasión de probarla.
Es la nueva función de Gemini que está disponible en Labs, y que me apareció este domingo pasado con la suscripción Pro. Se basa en enriquecer las respuestas que da la IA generativa a través de imágenes y gráficos, una maquetación más clara y atractiva e incluso módulos interactivos.
Se puede seleccionar desde "Herramientas", como si se hiciera con "Crear imágenes", y la experiencia imita la de una web o revista, ya que, en vez del texto plano al que estamos acostumbrados en ChatGPT, Gemini o Claude, aquí se hace a través de una forma visual e interactiva.
Podemos decir adiós a los prompts y dar clic sobre cualquier sección, elemento o botón, como si de una interfaz web se tratara, para que se genere más contenido e ir confeccionando una experiencia mixta visual y de texto.
Gemini con Diseño Visual también genera contenido en la forma de viñeta de opciones para que al elegir playa en vez de montaña, las vacaciones en verano, o que sea en un hotel en vez de un camping, el siguiente contenido se diseñe según estas elecciones.
Diseño Visual ya aparece para algunos usuarios en Gemini
En un primer momento es una experiencia que choca bastante al estar acostumbrados a las respuestas con texto, pero es como si fuésemos los diseñadores de un contenido que se visualiza en la forma de imágenes, tomadas de fuentes oficiales, o generadas por la propia IA al igual que nos puede dar enlaces a YouTube.
Todo comienza al seleccionar "Diseño Visual" en las herramientas de Gemini e introducir un prompt. Gemini visualizará varios recuadros de distintos tamaños para ir seleccionando el diseño, y al poco desplegará el contenido como si fuese una página web o revista.
Contenido generado según el prompt introducido "Dime las diferencias entre ir de vacaciones a un hoteo o hacerlo en un camping"
Un titular y luego un texto que, en el caso de "Hotel vs Camping" da un resumen rápido de lo importante. Y es que incluso da una comparativa con las distintas opciones que tenemos para irnos de vacaciones, cada opción con su propia imagen cabecera y en la que se pueden leer el coste, comodidad, interacción social, ubicación típica y flexibilidad.
La interacción es máxima y a continuación nos encontraremos con una tarjeta interactiva con estas opciones:
- Un control que podemos deslizar para indicar que preferimos el máximo confort o el máximo ahorro.
- Seleccionar entre cinco respuestas disponibles a la pregunta "¿Con quién viajas y qué ambientes buscas?".
- Cuestionario tipo "escala Likert" con sliders o puntos seleccionables: para elegir como irrelevante, agradable, importante o imprescindible la privacidad, acceso y otras opciones
Justo debajo se encuentra el botón "Enviar". Lo pulsamos y Gemini con "Diseño Visual" genera una respuesta según esas interacciones hechas en el contenido dinámico que nos muestra.
Una tarjeta en la forma de un pequeño cuestionario que se puede dar clic para perfilar la respuesta
Aparece un titular con "Recomendación: La mejor opción es un camping-resort o Glamping". Y más abajo nos ofrece otra comparativa como las tres mejores opciones y con todas sus características para que, al pulsar de nuevo, generar más contenido.
De hecho, si no elegimos ninguna de esas opciones, nos da más recomendaciones para planificar un viaje, y siempre relacionado con las indicaciones que hemos ido dando con clics.
En beta y repercusiones
Diseño Visual en Gemini, con toda la información desde la web de soporte de Google, no funciona siempre correctamente, y hay veces que se queda congelado con "Sintetizando solicitud" o simplemente da un error para generar cierto contenido.
Pero no quita que estemos ante el paso siguiente que quieren dar las compañías de IA generativa, ya que ChatGPT presentó hace poco a Pulse, su asistente que es capaz de enriquecer el contenido que necesitemos como aquel que tiene en el historial de conversaciones al igual que el resumen del día.
El nuevo contenido generado tras elegir nuestras prioridades en la captura de pantalla anterior
El objetivo no es otro que el usuario, en vez de consumir el contenido de las páginas web que suele visitar, lo haga desde el propio chatbot con IA. Esta experiencia se conoce como "Búsquedas Cero Clic" para que el motor de búsqueda de Google pase a un "motor de respuesta" desde Gemini.
Lo que hace Google con Diseño Visual es que cuando el usuario busque "mejores zapatillas para correr", en vez de ofrecerle 10 enlaces azules desde su buscador para que el usuario fuese a una web para ver el contenido, Google lo lea por el usuario, extraiga las fotos, el precio y opinión y monte una "mini-revista" interactiva dentro de Gemini.
Diseño Visual genera contenido como si fuera una revista o página web interactiva
Adiós al clic a esa web y hoy se ha abierto la puerta para que la Unión Europea abra una investigación antimonopolio sobre las prácticas de inteligencia artificial de Google según Engadget. La Comisión está investigando la falta de compensación por parte de Google a los editores de noticias y a los creadores de contenido de YouTube.
Y es de tal magnitud esta noticia al igual que Diseño Visual de Gemini, que la investigación que llevará a cabo la Unión Europea no usa la nueva Ley de Mercados Digitales (DMA), sino las leyes de competencia con abuso de posición dominante.
Lo que considera que Google está usando la fuerza bruta como buscador para asfixiar a los medios y otros desarrolladores de IA.
Un portavoz de Google declaró a Engadget que la investigación "corre el riesgo de sofocar la innovación en un mercado más competitivo que nunca. Los europeos merecen beneficiarse de las últimas tecnologías y seguiremos trabajando estrechamente con las industrias creativas y de noticias en su transición a la era de la IA".
