La traducción inteligente que se 'cocina' en Valencia: de la formación de oncólogos a los subtítulos en los informativos
Así es el grupo Machine Learning and Language Processing de la UPV, un grupo que ha trabajado para el CERN, para varias universidades y para televisiones públicas.
9 mayo, 2023 01:07No son el Equipo A. No fueron soldados de fortuna, ni mucho menos pisaron la cárcel por un delito que no habían cometido. Pero, sin embargo, si usted algún día tiene un problema, quizá pueda recurrir a ellos si ese problema tiene que ver con la traducción automática con inteligencia artificial.
Este grupo se hace llamar Machine Learning and Language Processing (MLLP) y pertenece al Instituto Universitario Valenciano de Investigación en Inteligencia Artificial (VRAIN) de la Universidad Politécnica de Valencia.
Su catálogo de proyectos -algunos concluidos y otros aún abiertos- es tan amplio que impresiona comprobar hasta dónde ha llegado el desarrollo de sistemas de aprendizaje automático, en este caso, aplicado a la subtitulación inteligente en tiempo real.
Precisamente el aprendizaje automático es una de las áreas de investigación de este grupo. Esta rama de la inteligencia artificial, cabe recordar, se ocupa del desarrollo de teorías y algoritmos para construir sistemas que puedan aprender de los datos.
La investigación de MLLP en este sentido cubre diferentes enfoques de aprendizaje automático, como el aprendizaje supervisado, semisupervisado, no supervisado, adaptativo y profundo, según explica el propio grupo. Se pone especial énfasis en diseñar algoritmos precisos y eficientes para tareas de aprendizaje automático de la vida real.
La segunda de las áreas de investigación es la del procesamiento natural del lenguaje, que se ocupa de las interacciones entre las computadoras y los lenguajes humanos naturales. La investigación del MLLP se centra en el desarrollo de tecnología de vanguardia para el procesamiento del lenguaje natural en muchos idiomas.
"El objetivo principal es facilitar la comunicación en línea multilingüe para superar las barreras del idioma en tareas desafiantes de lenguaje natural", remarcan.
Por último, la tercera de las áreas de investigación tiene que ver con el big data. En este sentido, desde el MLLP afirman que "las tecnologías educativas son un área en la que los datos masivos están cobrando impulso rápidamente".
Precisamente de esta área brota uno de los proyectos más impactantes de este grupo, la formación de especialistas en oncología a nivel europeo (dentro del proyecto INTERACT-EUROPE) gracias a su tecnología de subtitulación automática.
Esta tecnología de inteligencia artificial, basada en redes neuronales para el procesamiento del lenguaje natural y desarrollada tras años de experiencia, traducirá los materiales de formación del dominio oncológico entre varios idiomas como el inglés, alemán, francés, español y esloveno y permitirá también la accesibilidad a personas sordas.
El objetivo del proyecto INTERACT-EUROPE, con una duración prevista de 18 meses y con 33 organizaciones participantes de 17 países diferentes, es desarrollar un plan de estudios y un programa de formación en oncología a nivel europeo.
Además, fomentará un enfoque centrado en el paciente y será inclusivo, tanto geográfica como profesionalmente, para ofrecer múltiples oportunidades de formación interdisciplinar y lograr así una atención oncológica de calidad.
En este sentido, tal y como explica el profesor responsable y experto en tecnologías del lenguaje de VRAIN de la UPV, Jorge Civera Saiz, "la tecnología de transcripción y traducción simultánea en streaming desarrollada en el grupo MLLP es puntera a nivel internacional, como demuestra nuestro registro de publicaciones de alto impacto, siendo el único socio tecnológico experto en procesamiento del lenguaje natural en el marco del proyecto europeo INTERACT-EUROPE".
Formación inclusiva
Esta tecnología "posibilita la formación y accesibilidad de las personas independientemente del idioma y en tiempo real. Esto redunda en un mayor beneficio para la sociedad, como en el caso del proyecto mencionado, donde la tecnología va a permitir una mayor y mejor formación del personal sanitario articulando una atención oncológica de calidad mediante la promoción del trabajo interespecialidad en equipos multidisciplinares", añade Civera.
Este grupo, formado por doce investigadores, cuenta con años de experiencia en la transferencia de esta tecnología a la sociedad, como lo demuestran la primera posición de su tecnología de subtitulación automática de contenidos televisivos en las competiciones RTVE-IberSpeech Challenge 2018 y 2020, recuerdan desde la entidad. A nivel internacional, se ha situado "entre los mejores" en las competiciones WMT19 y Blizzard Challenge 2021, respectivamente.
Como decíamos, el catálogo de servicios de este grupo es amplio. Así, hay otras siete iniciativas que, actualmente, están desarrollándose con diferentes grados de ejecución.
Uno de ellos, EXPERT, está apoyado por el programa Erasmus+ de la Unión Europea y pretende facilitar entornos comunicativos eficaces en un entorno como el de esta iniciativa educativa europea.
Basado en el importante progreso reciente en la transmisión de reconocimiento automático de voz, traducción automática y texto a voz, el objetivo principal de otro de los proyectos, XLinDub, es implementar un enfoque en cascada de traducción de voz a voz para realizar el doblaje automático multilingüe en tiempo real de contenido educativo y parlamentario. Está financiado por el Ministerio de Ciencia e Innovación.
AutoLive, otro de los proyectos, también financiado por este ministerio, busca mejorar la tecnología del propio software del grupo de investigación MLLP.
Más llamativo es el cuarto de los proyectos que se están desarrollando en la actualidad, que tiene al CERN suizo como principal colaborador. El CERN quiere equipar todo su material multimedia fuera de línea con subtítulos de alta precisión en inglés y francés, y permitir que los organizadores de reuniones activen subtítulos en vivo de alta calidad de sus reuniones por videoconferencia. Es ahí donde entra la ayuda del MLLP.
Un contrato con la televisión autonómica valenciana (À Punt) para la subtitulación automática en informativos y otros dos acuerdos para la traducción simultánea de conferencias y materiales audiovisuales de universidades públicas como la Carlos III de Madrid y la UPV valenciana completan este catálogo de servicios.