Imágenes generadas por la IA de Google

Imágenes generadas por la IA de Google Imagen - Google Omicrono

Software

La magia del último algoritmo de Google: convierte cualquier texto en imágenes hiperrealistas

La idea es que los usuarios puedan introducir un texto descriptivo para que una inteligencia artificial lo convierta en una imagen de alta resolución.

1 junio, 2022 10:13

Noticias relacionadas

Las aplicaciones de la inteligencia artificial siguen sorprendiendo día a día. Desde aprender a programar, reconstruir una obra de Rembrandt hasta vigilar a los políticos belgas, el potencial de esta tecnología no parece tener límites. Hace poco veíamos cómo la inteligencia artificial DALL-E de Open AI era capaz de crear obras de arte con solo describirlas con una frase, y Google ya se ha propuesto superarla en realismo y resolución con Imagen, que convierte cualquier texto en imágenes de lo más sorprendentes.

La empresa afirma que el modelo de difusión de imágenes, creado por el Brain Team de Google Research, ofrece "un grado de fotorrealismo sin precedentes y un profundo nivel de comprensión del lenguaje". Así, el gigante tecnológico busca crear obras más realistas, poniendo a prueba el algoritmo con descripciones largas y complejas, y ampliarlas hasta una resolución de 1024x1024 píxeles.

Para evaluar Imagen frente a otros modelos similares, como DALL-E, los investigadores crearon una prueba de referencia llamada DrawBench, una lista de 200 mensajes de texto que se introdujeron en cada modelo. Luego se pidió a calificadores humanos que evaluaran cada imagen. Según Google, "prefieren Imagen sobre otros modelos en las comparaciones paralelas, tanto en términos de calidad de la muestra como de alineación imagen-texto".

Hay que tener en cuenta que los ejemplos que aparecen en el sitio web de Imagen están supervisados, así que es muy probable que se trate de las mejores imágenes creadas por el modelo. Es decir, que puede haber muchas imágenes descartadas que no reflejan con exactitud la descripción del texto.

En cualquier caso, la iniciativa ha dado origen a divertidas composiciones, con un nivel de detalle asombroso, como las que ha compartido en Twitter Jeff Dean, uno de los responsables del proyecto. El título ya es divertido, pero visto junto a la imagen el resultado es asombroso: "Un retrato de alto contraste de un panda peludo muy feliz vestido de chef en una cocina de alto nivel haciendo masa. Hay un cuadro de flores en la pared detrás de él".

De momento, Imagen no está disponible para el público general. La compañía de Mountain View no cree que esté preparada todavía para que lo utilice cualquiera, porque los modelos de conversión de texto en imágenes suelen entrenarse con grandes conjuntos de datos. Estos se extraen directamente de la web y no son supervisados, lo que plantea problemas, como la presencia de "sesgos sociales y limitaciones de los grandes modelos lingüísticos", lo que puede representar "estereotipos y representaciones perjudiciales". 

No obstante, puedes probar Imagen de forma limitada. En su sitio web, se puede crear una descripción utilizando frases preseleccionadas. Los usuarios pueden seleccionar si la imagen debe ser una foto o una pintura al óleo, el tipo de animal que aparece, la ropa que lleva, la acción que está realizando y el escenario.

Así que, si alguna vez has querido ver un majestuoso cuadro al óleo de una reina mapache vestida con un traje real francés de color rojo, colgado en una pared ornamentada y decorada con papel pintado, esta es tu oportunidad.

También le puede interesar: