Se ha hablado mucho del potencial de las redes neuronales en la modificación y creación de imágenes; un campo con mucho potencial, como demuestran proyectos capaces de crear fotos de personas inexistentes, sólo aprendiendo a partir de enormes bases de datos de imágenes. Pero aunque eso parezca impresionante, la verdad es que el potencial es incluso mayor, como ha demostrado Nvidia en su conferencia GTC 2019.

Nvidia es una de las compañías que más está apostando por las diversas utilidades del aprendizaje automático e Inteligencia Artificial; no en vano ofrece GPUs muy capaces en los cálculos necesarios para hacer estos proyectos realidad. Para demostrarlo, han presentado GauGAN, un programa que es capaz de crear imágenes a partir de simples bocetos dibujados por el usuario.

La IA de Nvidia consigue crear fotos a partir de dibujos de Paint

Y cuando digo “bocetos” quiero decir “dibujos de Paint”, porque eso es lo que parece. Si tienes una capacidad artística nula como yo, estos croquis son lo máximo que puedes conseguir con un programa de dibujo; pero es más que suficiente para que el sistema de aprendizaje automático GAN (Generative Adversarial Network) haga su trabajo. Como su nombre indica, estos sistemas funcionan enfrentando a diferentes redes entre si, hasta conseguir el mejor resultado posible.

nvidia inteligencia artificial dibujo 1

Usando este sistema, GauGAN es capaz de convertir cualquier dibujo en una fotografía realista; todas las partes del dibujo quedan representadas con texturas y objetos como serían en la vida real. Los bloques verdes se convierten en grandes pastos, líneas grises se convierten en nubes, y una línea azul se convierte en una catarata en medio de la montaña. Todo se traduce a una imagen muy parecida a lo que tendríamos en nuestra cabeza cuando hicimos el dibujo.

La verdad es que GauGAN hace algo de trampa; aunque parezca un programa parecido al Paint, en realidad cuando elegimos los colores estamos indicando el tipo de material que queremos usar. El azul más claro es el cielo, el gris son las nubes, y las diferentes tonalidades de verde son árboles, plantas, matorrales, etc. Sabiendo eso, el programa “sólo” tiene que cambiar esas partes por las texturas apropìadas; el verdadero desafío está en integrarlas de manera natural. En el mencionado ejemplo de la cascada, el sistema sólo sabe que es una línea de “agua” en medio de una porción de “roca”; es su trabajo interpretar eso y llegar a la conclusión de que es una catarata que cae en el río de abajo.

Una demostración de lo que es posible con redes neuronales

De esta forma, GauGAN produce siempre resultados únicos para cada dibujo; cámbialo un poco, como añadiendo otro objeto o cambiando el color de una parte, y obtendrás un resultado muy diferente. Además, el programa genera números aleatorios para que, incluso aunque dos usuarios dibujen lo mismo, siempre se obtengan fotos diferentes.

GauGAN ha sido demostrado usando la plataforma RDX Titan de Nvidia, y por lo tanto es más una demostración para empresas e investigadores; en esta plataforma, los cambios se efectúan en apenas unos segundos, aunque en teoría es posible ejecutarlo en cualquier CPU si estamos dispuestos a esperar mucho más tiempo. Este programa estará disponible en AI Playground, la plataforma de Nvidia, cuando esté terminado, aunque por el momento no hay fecha.

Noticias relacionadas