Voces de actores generadas por IA

Voces de actores generadas por IA ElevenLabs-Omicrono Omicrono

Tecnología

Actores que durarán para siempre: así está aprovechando Hollywood el poder de la IA con el beneplácito de los artistas

Grandes estrellas han decidido prestar su voz para que otros generen versiones basadas en IA de gran realismo y expresividad, así funciona.

Más información: La amenaza de que la IA replique tu voz: de acabar con los dobladores a que suplanten tu identidad

Publicada

La realidad más temida hace solo dos años en Hollywood se ha vuelto una realidad difícil de eludir. Las voces de grandes actores se usan ahora para crear contenido con versiones generadas por IA cuyo realismo y expresividad no deja indiferente. Algunos cuentan con el permiso de los artistas, otros no.

Las principales asociaciones de guionistas y actores como el SAG-AFTRA (Sindicato de actores de Cine-Federación estadounidense) se pusieron en pie de guerra y organizaron una importante huelga en 2023 como protesta entre otras cuestiones por la posibilidad de usar réplicas de IA de sus actores y usarlas gratis de por vida.

Aunque son muchos los rostros conocidos que han criticado el uso de esta tecnología en el cine y los riesgos que supone para la autenticidad de la industria y la integridad de su imagen y trabajo, otros han decidido abrazar las posibilidades que ofrece la inteligencia artificial generativa prestando su voz al servicio de esta nueva era.

La voz del galardonado actor Sir Michael Caine está ahora disponible en la aplicación de la empresa Eleven Labs su recién lanzado Iconic Marketplace. "Durante años, he prestado mi voz a historias que han conmovido a la gente: relatos de valentía, ingenio y fortaleza humana. Ahora, ayudo a otros a encontrar la suya" ha dicho el actor para este anuncio.

Otras voces mundialmente famosas como Matthew McConaughey también se han sumado a este proyecto que ofrece la posibilidad de crear audios con voces de personas famosas, vivas o muertas, pero siempre bajo la autorización y supervisión de los que ceden su voz.

Aseguran que esta tecnología se ha creado para dar una solución "ética" al desafío que supone la IA actualmente en Hollywood. En paralelo, el gigante de la interpretación, Morgan Freeman, ha denunciado el uso de su voz sin su consentimiento, aunque no indica quién habría hecho uso de este recurso sin su permiso.

Contenido creado con control

Actores de cine y televisión de todo el mundo han expresado su temor de que la IA se pueda usar para duplicar sus caras y voces, y sustituirlos por algoritmos que salgan más baratos. El último caso ha sido el de Tilly Norwood, la actriz ha sido creada expresamente para interpretar escenas que no requieran un intérprete humano. Esta iniciativa ha generado una reacción tan negativa en Hollywood, que sus creadores han tenido que salir a dar explicaciones.

Pero algunos han decidido participar en esta nueva ola de forma voluntaria de la mano de proyectos como el Iconic Marketplace creado por esta empresa con sede en Nueva York y que definen su servicio como "la plataforma de IA de voz más realista".

La capacidad de replicar voces humanas y darles toda clase de expresividad y entonación es una de las cualidades de esta empresa, pero también su intención de usar este servicio de forma ética y controlada. Según Sir Michael Caine: "no se trata de reemplazar voces, sino de amplificarlas, abriendo puertas a nuevos narradores en todas partes ".

Desde Iconic Voices Marketplace se permite a otras marcas o creadores de contenido generar audios con voces de personajes conocidos mediante la Inteligencia Artificial. En la lista de personalidades disponibles hay nombres de grandes estrellas fallecidas como John Wayne, Rock Hudson y Judy Garland, incluso celebridades fuera del mundo del cine, como Amelia Earhart, J. Robert Oppenheimer y Alan Turing.

Matthew McConaughey, quien ha invertido en la empresa y colaborado con ella desde 2022, ha dado permiso a la empresa para doblar al español su boletín "Lyrics of Living", como si la leyera el actor en este idioma, para "poder llegar a más personas".

Esta tecnología abre un mundo de posibilidades, algunas peligrosas. Un informe publicado en septiembre de NCC Group advierte del riesgo de esta tecnología en temas de ciberseguridad en ataques phishing que recrean la voz de una víctima en tiempo real.

@elevenlabs With ElevenLabs’ Voice Changer, you can turn your voice into anything you can imagine. Want a deeper voice? Maybe more raspiness? Or you might just want to sound like an Alien… Whatever it is, you can create it with Voice Design v3. Use this for your content, audio projects and AI films. #madewithelevenlabs #elevenlabs #aiaudio #aivoices #aicreator #aicreators #voicechanger ♬ original sound - ElevenLabs

Para ofrecer un marco de seguridad a las celebridades que prestan sus voces al proyecto, se ha diseñado un sistema de licencias. Quien quiera usar la voz de alguno de estos famosos debe enviar una solicitud que es revisada y aprobada por el artista o su titular de derechos autorizado, quien decide si procede seguir adelante. Explica la empresa, que enviar una solicitud no implica que se conceda la licencia: la aprobación depende de factores como el contenido del proyecto, la adecuación a la marca y la disponibilidad del artista.

"Cada aprobación incluye los derechos comerciales para la narración de historias de alta calidad en diversos medios", reza la página web de Eleven Labs. La empresa no indica cuánto dinero recibe el artista o titular de esa voz, tampoco si cobra por cada uso de su voz o solo la primera vez.

El modelo V3 de texto a voz más expresivo

Una vez conseguida la licencia, el audio se crea partiendo de un guión. La empresa presentó el pasado 16 de octubre su última actualización, el modelo Eleven v3, que describen como "el modelo de texto a voz más expresivo". Puede generar audio en más de 70 idiomas, con diálogos con múltiples locutores y darle una amplia variedad de entonaciones.

Ejemplo de guion con múltiples voces y etiquetas de entonación.

Ejemplo de guion con múltiples voces y etiquetas de entonación. ElevenLabs-Omicrono Omicrono

Esta nueva versión está recomendada para vídeos largos o audiolibros en los que se necesite un alto nivel de expresividad. Pero cuentan con otras versiones más enfocadas en generar conversaciones en tiempo real, lo que puede ser de utilidad en ruedas de prensa o conferencias donde se escuche en varios idiomas la voz de la persona que está presentando.

En el caso de los proyectos con guión, es posible dirigir las voces para que rían, susurren, actúen con sarcasmo o expresen curiosidad, entre muchos otros estilos. La velocidad también se controla mediante etiquetas de audio. Se pueden añadir sonidos y efectos ambientales.

Además de incluir variaciones de acentos, como indicar en un momento dado que se lea una simple frase con un acento francés fuerte. La puntuación también es importante, por ejemplo, los puntos suspensivos añaden pausas y peso.