Los algoritmos generativos y la remezcla permanente

La era de la algoritmia generativa acaba prácticamente de empezar —comenzó el 30 de noviembre de 2022 cuando OpenAI lanzó ChatGPT, o más propiamente, pero a menor escala, cuando lanzó Dall·E en enero de 2021— y ya nos estamos encontrando con todo tipo de problemas con respecto al término que define esos algoritmos: la palabra "generativos".

En efecto, la generación de algo, en este caso, depende de un proceso de entrenamiento a partir del cual un algoritmo es capaz, mediante el aporte de numerosos datos, de obtener una serie de vectores y reglas que relacionan conceptos y, con eso, generar otras cosas, sean imágenes, textos, vídeos o lo que se nos ocurra en función de los datos con los que fue entrenado.

A partir de ahí, la sucesión de artistas, cómicos, medios de comunicación, repositorios de imágenes o cada vez más compañías de todo tipo que han ido demandando a los creadores de algoritmos por sospechar, con bases en muchos casos muy fundadas, que sus datos habían sido utilizados para entrenar algoritmos sin su consentimiento, ni sin mediar compensación alguna.

Las compañías creadoras de algoritmos parecen estar optando por cerrar acuerdos económicos con las compañías que poseen grandes repositorios de contenidos

Esas demandas están aún en proceso, y los jueces que deben decidir sobre ellas se encuentran ante la tesitura de elegir basarse en obras de terceros que habían sido publicadas en abierto es algo que debe ser permitido o no: después de todo, si uno va a un museo y se inspira en las obras que ha visto en él para crear otra obra con un estilo similar, tendemos a considerarlo algo razonable y, por lo general, permitido. Pero entre hacerlo así y llevarlo a la escala industrial, obviamente, media un abismo, y ya veremos por dónde se inclinan los jueces.

Por ahora, las compañías creadoras de algoritmos parecen estar optando por cerrar acuerdos económicos con las compañías que poseen grandes repositorios de contenidos, y aquí paz y después gloria. Pero como ha ocurrido muchas veces en la historia de la tecnología, son muchas las cosas que parecen asentarse sobre terrenos resbaladizos.

Ahora, además de los algoritmos, debemos pensar en las aplicaciones que corren sobre estos. Tenemos ya aplicaciones que utilizan algoritmos generativos para crear, a partir de un texto o de unas instrucciones más o menos específicas, cosas como vídeos o, lo último que he visto y me ha divertido mucho, música.

Un servicio, Suno, permite pedir una canción —en realidad, genera un par de minutos en la versión gratuita— a partir de una idea sucintamente descrita, y de un estilo determinado. Dile que genere un reguetón latino que describa tus vacaciones, cuéntale cómo fueron, y lo tendrás en escasos minutos. Si quieres dar un paso más, puedes escribir tú mismo la letra, o incluso escribirla y pedirle que la intente rimar (básicamente, con repeticiones, muletillas, y yeah-yeahs).

Terminan solucionando sus problemas a base de formulaciones variadas de los derechos de autor, de manera a veces discrecional

¿Qué está haciendo Suno? Obviamente, ha sido alimentada con canciones de muchos estilos, y a partir de ahí, genera melodías con las letras que el usuario le indica de manera más o menos precisa. Es decir, en otras palabras, se dedica a remezclar muchos ingredientes con los que ha sido previamente entrenado, para obtener otros nuevos más o menos originales. Con eso, y si no se tienen muchas pretensiones, se puede crear desde un jingle para una campaña, hasta una cancioncilla para hacerle una broma a alguien… o ya con un poco de voluntad y seguramente, con la versión de pago, una posible pieza que valga la pena. O no.

¿A dónde voy con esto? Pues que si muchas compañías o creadores son simples aficionados a esto de la remezcla y los derechos de autor, se me ocurre alguien que no lo es: las compañías discográficas. Empresas que llevan años enfrentándose a artistas que "se inspiran" en otros artistas, y que terminan solucionando sus problemas a base de formulaciones variadas de los derechos de autor, de manera a veces discrecional: sabemos que si hacemos algo que es claramente una versión, los creadores del original percibirán algún tipo de derechos… pero si un artista samplea algo de manera más o menos discreta, tal vez no lo digan nada. Michael Jackson, por ejemplo, confesó a Daryl Hall haber copiado el bajo de Billie Jean de una canción suya, y Hall replicó que él mismo la había tomado de otra canción y que era algo que todos hacían.

Peor es cuando, en otras ocasiones, un creador es acusado —y llevado a los tribunales— por los herederos de otro músico por supuestamente inspirarse en él, aunque no le haya copiado realmente una sola melodía… y los tribunales fallan a su favor.

La pregunta es, claro, qué va a pasar ahora, cuando cualquiera pueda generar una canción y el resultado provenga, sí, de infinidad de otras canciones con las que se entrenó a un algoritmo, pero sin que haya forma sencilla de saber cuáles fueron. ¿Cómo nos vamos a enfrentar a una posible hiperinflación de canciones generadas por algoritmos, con melodías que nos pueden "sonar conocidas" o "en un estilo determinado", pero que no sabemos cómo han sido obtenidas? Si con las descargas irregulares, los directivos de esa industria ya liaron la que liaron en su momento, espera a que vean las canciones generadas algorítmicamente e "inspiradas" en otras… que seguro que les van a encantar.

Decididamente, vienen tiempos interesantes. Pero me da que no todos los implicados van a tener el mismo interés.

***Enrique Dans es Profesor de Innovación en IE University.