Fotomontaje inspirado en Gemini y Google Manuel Ramírez / 9to5Google

Noticias y novedades

Gemini, la IA de Google, ya permite editar imágenes como ChatGPT: así se cambia el color de tu pelo o el estilo de tu foto

Google no deja que ChatGPT desaparezca por el horizonte en esta carrera infinita en la que ambos se ven enfrentados.

Más información: Google anuncia la edición I/O de Gemini 2.5 Pro, la IA que ha dejado en ridículo a ChatGPT en escritura y programación

Manuel Ramírez

Publicada 8 mayo 2025 10:13h

Google anunció de forma oficial la edición de imágenes en Gemini para contrarrestar una de las funciones de ChatGPT que se convirtió en tendencia en todo el mundo con las ediciones estilo Studio Ghibli. Ahora está desplegando la nueva funcionalidad que permite alterar rápidamente cualquier objeto o elemento de una fotografía, o aplicar un estilo concreto para darle una vuelta de tuerca a una imagen.

ChatGPT a través de su modelo de generación de imágenes fue capaz de sorprender a medio mundo al aplicar todo tipo de retoques o darle ese estilo de dibujo y acuarela del reconocido estudio de animación Studio Ghibli. Lo que hizo que convertir una fotografía nuestra en un meme o una imagen para la posteridad fuera sumamente sencillo.

Y aquí Google ha tardado un mes en llevar la misma experiencia a su modelo de generación de imágenes en Gemini para que se pueda editar cualquiera de las imágenes subidas o la que haya generado la IA de Google. Aquí prima que Gemini mantendrá siempre el sujeto principal de la fotografía para realizar una edición.

Por lo que podemos tomarnos todo el tiempo del mundo para ir introduciendo prompts hasta dar con el resultado buscado. Se puede cambiar el fondo de la imagen, sustituir objetos e incluso añadir elementos. Según mantiene 9to5Google, también se pueden cambiar el estilo de la fotografía para que a nuestro perro se le pueda añadir una gorra y justo después decirle a la IA que cambie el color de la hierba de verde a azul.

Otra idea sería subir una foto propia y decir a Gemini que cambie el color del pelo o tono al igual que la ropa que llevemos puesta en esa imagen. Las posibilidades son infinitas e incluso la propuesta se basa en la capacidad de que se pueda usar cualquiera de las imágenes ya editadas para añadir o quitar elementos al igual que aplicar estilos.

La edición de imágenes de Gemini 9to5Google

Google también mantiene que esta nueva experiencia de Gemini permite realizar ediciones de varios pasos para empezar con un prompt en texto, y cuando se genere la primera imagen, subir nosotros una o varias para darle la idea exacta de la imagen final que queremos. Una experiencia más flexible sobre todo porque Gemini ya permite cargar varias imágenes a la vez como otra de las novedades lanzadas en los últimos días.

Por lo que respecta a la marca de agua, ahora todas las imágenes creadas o editadas con la generación por IA incluirán una marca digital SynthID. Se podrá ver justamente posicionada en la parte inferior derecha de cada imagen. Aquí sigue los pasos de Adobe con Firefly que cuida bien que todo lo generado con su modelo de IA tenga su marca de agua.

[Google deja en ridículo a ChatGPT y su modelo de voz: Gemini Live va a interactuar con las apps de tu móvil]

La edición de imágenes con IA utiliza Gemini 2.0 Flash, aunque esta funcionalidad se puede usar con cualquiera de los modelos disponibles desde la app para móviles o la versión web. Los desarrolladores, según el anuncio de Google hecho hace unas horas, ya pueden editar imágenes y utilizar Gemini 2.0 Flash Image Generation desde el previo. Las mejoras van desde el incremento de la calidad visual y una representación del texto más precisa a la reducción significativa de las tasas de bloqueo de filtros.

Más en Noticias y novedades