Poco a poco, han llegado titulares en España no demasiado alentadores respecto a la IA y al copyright. Japón se encuentra en pie de guerra contra OpenAI, y numerosos artistas y colectivos ya han puesto el grito en el cielo sobre el robo de contenido de los modelos de IA.
El último varapalo contra los desarrolladores de ChatGPT viene de Alemania, donde un tribunal ha sentenciado a OpenAI por violación de las leyes de derechos de autor locales. El motivo: usar las letras de canciones famosas para entrenar modelos GPT.
La denuncia realizada por la sociedad alemana de derechos musicales GEMA ha dado como resultado una sentencia en la que se determinó el uso indebido de estas letras por parte de OpenAI, aunque ya han anunciado que la recurrirán.
OpenAI, condenada en Alemania
El tribunal regional de Múnich dictaminó que, a su juicio, OpenAI presuntamente usó contenido protegido por derechos de autor para estos procesos de entrenamiento. En concreto, se usaron nueve temas de artistas alemanes.
Específicamente ha sido la Sala Civil 42 del Tribunal Regional de Múnich especializada en derechos de autor la que en un comunicado ha anunciado la estimación de las demandas de GEMA contra los de Sam Altman.
ChatGPT
GEMA es una sociedad de gestión colectiva en la que se aglutinan editores, letristas, compositores y por supuesto artistas del panorama musical alemán. Esta asociación argumentó que las letras de las canciones involucradas estaban "memorizadas" en los modelos de lenguaje de OpenAI.
"Cuando se utilizaba el chatbot, las respuestas (resultados) a las consultas sencillas de los usuarios eran en gran medida fieles a la original", explica el tribunal en su comunicado de prensa.
En este sentido, se recoge la alegación en contra de dicha sentencia de OpenAI, que negó que sus modelos de lenguaje almacenasen o copiasen datos de entrenamiento específico.
El logo de ChatGPT.
Así, OpenAI se defendió argumentando que, debido a que estos resultados se generaban por la mano del usuario, este era el responsable de producir tales resultados y no la compañía acusada.
La sentencia es clara: el tribunal "está convencido de que la letra de las canciones en cuestión se encuentran reproduciblemente contenida en los modelos de lenguaje 4 y 4o del acusado", es decir, dos de sus últimos modelos.
El organismo judicial incide sobre el proceso conocido como memorización. Refiere a cómo los datos de entrenamiento pueden estar contenidos en modelos de lenguaje y extraerse como resultados en sistemas como ChatGPT.
La memorización se sucede en el entrenamiento de los modelos. Consiste en que un modelo de IA no solo aprende tendencias o información general de su conjunto de datos, sino que llega a incorporar partes completas de los datos originales en sus parámetros internos.
Sam Altman, CEO de OpenAI
De esta forma, al recibir ciertas consultas simples, el modelo puede devolver segmentos sustanciales de texto original ubicado en los conjuntos de datos. El tribunal ha considerado que esto supone una 'reproducción' del contenido según las leyes de copyright de alemanes.
Básicamente, el organismo jurídico entiende que tanto este proceso de memorización como la propia reproducción de las letras de las canciones en estas respuestas constituyen infracciones en los derechos de explotación de derechos de autor de los temas implicados.
"Esta memorización se confirmó al comparar la letra de la canción contenida en los datos de entrenamiento con su reproducción en los resultados. Dada la complejidad y la extensión de la letra, se descarta el azar como causa de su reproducción", dijo el tribunal.
Entre las canciones usadas para los procesos de entrenamiento nos encontramos temas como Maenner o Bochum, de Herbert Grönemeyer o Atemlos y Wie schön, de Kristina Bach y Rolf Zuckowski, respectivamente.
El logo de ChatGPT.
OpenAI también aseguró que ChatGPT reflejaba por completo en sus parámetros todo lo aprendido en su conjunto de datos de entrenamiento, aunque dicho alegato fue desestimado por la jueza.
Por supuesto, desde GEMA celebran la decisión, asegurando que se ha sentado un precedente sobre la protección de los derechos de autor de los artistas. "Internet no es una tienda de autoservicio", declaró Tobias Holzmueller, su CEO.
Aún con todo, la decisión será apelada por parte de OpenAI. Un portavoz de la compañía ha asegurado que los de Altman no están de acuerdo y que ya estudian "los próximos pasos", negando que este caso afecte a los "millones de personas, empresas y desarrolladores" que usan ChatGPT a diario.
