Fotomontaje inspirado en Gemini Manuel Ramírez El Androide Libre

Noticias y novedades

Gemini, la IA de Google, ya permite cargar varias imágenes como ChatGPT para generar una o consultas complejas

El gigante tecnológico sorprende con una nueva función de su IA que permite generar o hacer consultas basadas en varias imágenes subidas.

Más información: Google volvería a dejar en ridículo a ChatGPT con la nueva capacidad de su IA: subirás vídeos y así los analizará

Manuel Ramírez

Publicada 5 mayo 2025 19:44h

Después de lanzar la generación de vídeo Veo 2 en España, el gigante tecnológico está actualizando su modelo de generación de imágenes de Gemini para ofrecer una mejor experiencia en la carga de imágenes: que podamos subir varias en un único prompt. Lo que va a permitir que podamos mezclar personas o distintos estilos en una imagen generada.

Varios usuarios de la red social Reddit han reportado que la interfaz web de Gemini ya permite la carga de varias imágenes a la vez para usar con un prompt. Se puede ver en una de las capturas compartidas a tres personajes juntos en una imagen para enmarcar: Spider-Man, Ryu y Willy Wonka.

Justo arriba de la imagen se puede ver cómo se cargaron las tres imágenes de los personajes para incluirlas en el prompt que indica que han de aparecer los tres en un bar juntos. Esta nueva experiencia de generación de imágenes no está disponible de forma general, y de momento para muchos está limitada a la carga de una única imagen.

Hemos intentado cargar varias fotos en las distintas cuentas de Google y en nuestro caso es imposible cargarlas para crear un prompt divertido como el que ha tomado como ejemplo Android Police desde las cuentas de usuarios de Reddit. Y es que, de momento, parece que solo está disponible desde la versión web de Gemini, y ni por antojo ha asomado la posibilidad de hacerlo desde la versión para móviles.

De hecho, si se intenta añadir otro archivo de imagen después de hacerlo con uno desde el botón "+", se puede leer que no se pueden subir más, así que habrá que esperar a que Google despliegue esta nueva capacidad que ya ofrece ChatGPT desde hace un tiempo para mezclar varias imágenes en una generación por IA.

Ejemplo en Gemini en su versión web Reddit

Y no solo sirve para generar una imagen que mezcle las cargadas a la interfaz web de Gemini, sino para hacer consultas más detalladas de algún objeto para así mostrar la parte frontal y la trasera o distintas perspectivas de una planta para que así la IA de Google ofrezca mejores respuestas.

En este tipo de novedades es donde se encuentra ahora mismo la carrera en la que compiten Google con Gemini contra OpenAI y ChatGPT, y al igual que otras se quieren sumar como le sucede a Anthropic, aunque todavía no ha sido capaz de lanzar un modelo avanzado de voz para dar una alternativa a Gemini Live y el de ChatGPT.

[Gemini Live estrena en España las dos funciones con las que ha superado a ChatGPT: gratis para los Google Pixel 9 y Galaxy S25]

Según Android Police, sí que parece que esta nueva función estará disponible de momento para los suscriptores de Gemini a través de Advanced. Es decir, que el resto de usuarios que usan Gemini de forma gratuita tendrán que esperar para poder hacer consultas más complejas o se pueda generar una imagen basada en otras cargadas a Gemini.

Más en Noticias y novedades