Nadia Calviño y Pedro Sánchez.

Nadia Calviño y Pedro Sánchez.

España

El Gobierno aprueba este martes el PERTE del español: siete ejes que se extenderán a las lenguas cooficiales

Regado de fondos europeos, se busca sacar valor del español y el resto de lenguas cooficiales en tecnologías como la inteligencia artificial.

1 marzo, 2022 05:30
Barcelona

Noticias relacionadas

Este martes, el Ejecutivo de Pedro Sánchez dará luz verde al PERTE del español en el Consejo de Ministros. Se trata de uno de los últimos proyectos de recuperación, financiados con los fondos europeos, que el Gobierno dio a conocer antes de acabar el pasado año.

"Mañana mismo vamos a presentar un proyecto estratégico, el PERTE de inteligencia artificial y la nueva economía de la lengua, para aprovechar plenamente la capacidad del español y del resto de lenguas cooficiales en esta nueva realidad de la inteligencia artificial", ha adelantado este lunes la vicepresidenta económica, Nadia Calviño, en la Cadena SER.

Se cumple así la promesa realizada en aquel momento -la de presentar el plan en el primer trimestre del año-, del cual se desconoce todavía el montante total con que estará dotado. Sí se conocen cuáles serán las líneas maestras de este PERTE, organizado en torno a áreas como la propia inteligencia artificial, ciencia en español, aprendizaje del idioma en el mundo, turismo vinculado a la lengua, industrias culturales, español global y lenguas cooficiales.

En ese sentido, lo que sí ha confirmado Nadia Calviño, ya en el Mobile World Congress, es que alrededor de 30 millones de euros de este PERTE irán destinados a este último apartado, el de las lenguas cooficiales. Una partida que responde a los compromisos ya alcanzados en el pasado por el Gobierno con sus socios políticos de Cataluña y Euskadi.

Inteligencia artificial que 'hable' español

Fuentes del Gobierno confirman a D+I que el proyecto fue coordinado por la Secretaría de Estado de Digitalización e Inteligencia Artificial, pasando luego a los dominios inmediatos de Nadia Calviño en el Ministerio de Economía. Y, como decimos, entre otras líneas de trabajo, en el PERTE habrá un eje concreto de inteligencia artificial, con una clara intención de utilizar el idioma como un diferenciador claro de la propuesta tecnológica nacional.

Recordemos que la mayoría de los sistemas de inteligencia artificial -en especial, los relacionados con el procesamiento del lenguaje natural, como los asistentes virtuales- son entrenados en inglés o en chino. Una vez entrenados en esos idiomas, las grandes tecnológicas simplemente traducen los resultados a las distintas lenguas de los mercados en que operan.

De hecho, el castellano apenas representa el 30% del mercado mundial de las tecnologías de procesamiento de lenguaje natural. Un fenómeno que viene de lejos y al que ya se ha tratado de poner solución desde hace tiempo. De hecho, en 2015, con Mariano Rajoy aún de presidente, el Ejecutivo lanzó el Plan de Tecnologías del Lenguaje que inició la particular senda que culmina en el actual PERTE.

Un proyecto estratégico que ya estaba presente en la Estrategia Nacional de Inteligencia Artificial -recogida en el componente 16 del Plan de Recuperación-, que contemplaba una partida de 28 millones de euros en tres años para el Plan de Tecnologías de Lenguaje Natural. 

Los proyectos ya existentes

Aunque los detalles del PERTE del español todavía no son conocidos, lo que sí sabemos son los propósitos y esfuerzos realizados hasta ahora por algunas iniciativas público-privadas para la promoción del idioma en la inteligencia artificial.

La más ambiciosa es el proyecto LEIA, impulsado por la RAE con el apoyo de las 'big tech' (Telefónica, Google, Amazon, Microsoft, Facebook o Twitter, entre otras).

En este marco, las tecnológicas se comprometían a utilizar los materiales de la RAE (diccionarios, gramática, ortografía...) en el desarrollo de sus asistentes de voz, procesadores de texto, buscadores, chatbots, sistemas de mensajería instantánea, redes sociales y cualquier otro recurso, así como a seguir los criterios sobre buen uso del idioma aprobados por la Real Academia Española.

El otro gran proyecto ya existente en nuestro país es conocido como MarIA, en esta ocasión fruto de una alianza entre el Barcelona Supercomputing Centre, IBM, el gobierno central y la Biblioteca Nacional.

En esta ocasión, se buscaba desarrollar un sistema de inteligencia artificial experto en comprender y escribir la lengua española. Para ello, el sistema fue entrenado con archivos de la Biblioteca Nacional de España (se utilizaron 59 terabytes del archivo web de la institución) usando la tecnología del superordenador MareNostrum. Según sus impulsores, esta tecnología puede emplearse en predictores y correctores lingüísticos, chatbots, aplicaciones de resumen automático, búsquedas inteligentes, aplicaciones para el análisis de sentimientos o motores de traducción y subtitulación automática, entre otras aplicaciones.