Qwen-Image-2512
Ni Nano Banana ni ChatGPT, el nuevo modelo de IA Qwen-Image-2512: genera fotos con un realismo humano asombroso
Google está dominando la escena de la generación de imágenes con IA con modelos de código cerrado. La sorpresa es Qwen al ser libre.
Más información: Qwen-Image es un nuevo modelo de IA que ha logrado lo inaudito: incrustar texto en las imágenes increíbles que genera
Qwen-Image ha sido capaz de hacerse con un sitio en el cada vez más difícil campo de la generación de imágenes con IA. Ahora acaba de anunciar Qwen-Image-2512, su modelo de IA para imágenes desde texto.
La última actualización recibida fue en agosto y ya supuso el asalto al modelo de imágenes con IA de ChatGPT justo un poco antes de la irrupción del tsunami que ha supuesto Nano Banana de Google.
Qwen-Image-2512 hace que las fotos que genera parezcan más reales y se caracteriza por esas imperfecciones que hacen que las fotografías sean más 'humanas'.
Sobre todo ha mejorado este tipo de contenido generado por IA cuando las personas son las protagonistas de las generaciones.
También se ha mejorado notablemente el renderizado de detalles de los paisajes, pelaje animal y otros elementos naturales.
El realismo humano de Qwen-Image-2512
Qwen-Image-2512 da un salto hacia adelante en la incrustación de texto con varias mejoras: precisión y calidad de elementos textuales al lograr una mejor disposición y composición multimodal (texto + imagen) más fiel.
Es otro de los campos de batalla en los que se enfrentan los distintos modelos de IA dedicados a la generación de imagen y que, aunque se ha mejorado exponencialmente, no siempre se dan los resultados fielmente al 100 %.
Su rendimiento frente a Nano Banana Pro
Teniendo en cuenta que estamos frente a un modelo de código libre, su rendimiento incluso supera algunos de los modelos de código cerrado más conocidos.
Queda en la cuarta posición en la Tabla de Clasificación Elo de modelos de texto a imagen con una puntuación de 1011 para quedar empatado con Gemini 2.5 Flash Image Preview de Google.
Tabla de Clasificación Elo de modelos de texto a imagen
Gemini 3 Pro Image Preview sigue liderando esta tabla compartiendo esa posición con Imagen 4 Ultra Preview 0606 de la propia Google.
El logro de Qwen-Image-2512 pasa por ser la única IA de generación de imágenes de código libre que se encuentra entre los cinco primeros puestos donde Google se posiciona con un liderazgo absoluto.
Así son las imágenes que genera
Tenemos que irnos a Z-Image como el siguiente modelo de IA open source y que ha sorprendido por su gran eficiencia al ser un modelo de IA pequeño que incluso se puede instalar en móviles.
Qwen muestra desde su blog el ejemplo perfecto de las diferencias entre generar una imagen con su modelo anterior y con el nuevo, que lo clava en las imperfecciones que puede tener una fotografía hecha de una persona.
Generación de imágenes con Qwen-Image-2512
Sí que el prompt es bastante largo y descriptivo para lograr un resultado que hace que sea difícil distinguir si es una imagen real o falsa. Es justamente de lo que avisa Adam Mosseri, Jefe de Instagram, en una publicación hecha en su Instagram hace dos días.
No vamos a ser capaces de saber si una imagen es real o falsa, ya que Qwen-Image-2512, al igual que Nano Banana Pro, ahora recoge más detalles faciales y mejora los objetos de fondo como el cambio más significativo comparado con su anterior modelo.
Generación de detalles de pelaje de animales de Qwen-Image-2512
En las fotos de escenas naturales sí que ha logrado notables mejoras, pero se puede identificar como una imagen generada por IA, sobre todo en el pelaje.