Santiago Muñoz Machado, director de la RAE, en la presentación de la herramienta de IA junto a AWS.

Santiago Muñoz Machado, director de la RAE, en la presentación de la herramienta de IA junto a AWS.

España

Inteligencia artificial para que los "analfabetos" de internet aprendan a escribir: así vigila la RAE nuestro uso del español

La institución se alía con Amazon Web Services para crear una herramienta que capte y analice más de 8,7 millones de textos para conocer errores.

27 mayo, 2022 04:14
Madrid

Noticias relacionadas

El español, como cualquiera de los idiomas que nos permiten comunicarnos y que configuran el constructo social que llamamos Humanidad, es un organismo en continua evolución. Y, como tal, no está exenta de profundos procesos de transformación cuando las vías en que las personas nos relacionamos cambian de forma dramática.

La prueba más inmediata de esta realidad inexorable la encontramos en la actual revolución digital, que ha creado canales heterogéneos y de ritmo endiablado que han escapado a los mantras habituales que instituciones como la RAE han venido tratando de imponer en su particular misión de “limpiar, fijar y dar esplendor” a la lengua.

Hablando en plata: ¿Cuánta gente escribe correctamente en las redes sociales? ¿Cuántos aprovechan la informalidad de este canal para cometer todo tipo de tropelías contra las normas gramaticales y ortográficas? ¿Y estamos seguros de que los comentarios en foros o en tiendas online son escritos exclusivamente por eruditos magos de la palabra?

Por todo ello, la Real Academia Española lleva tiempo buscando la forma de monitorizar, evaluar y estudiar el uso del español en internet. Su propósito, ampliamente difundido, es el de crear un Observatorio de la Calidad de la Lengua en Internet. Pero procesar la cuasi infinita cantidad de conversaciones y textos que se publican en nuestro idioma en la red de redes resulta imposible a escala humana. Sin embargo, la RAE dará a conocer los primeros resultados de este observatorio antes de que acabe el año. ¿Cómo es posible?

La respuesta está en la tecnología y, en particular, en el uso de la inteligencia artificial. La RAE se ha aliado con Amazon Web Services, en el marco de la colaboración entre ambas entidades por el proyecto LEIA, para crear una herramienta automatizada que ha capturado ya más de 8,7 millones de elementos en 180 Gb de peso (desde comentarios en foros, en tiendas online, redes sociales o medios de comunicación) y, a partir de ellos, analizar su riqueza léxica (variabilidad y volumen), los errores lingüísticos más comunes (tipográficos, gramaticales, de estilo o puntuación) o por extranjerismos.

La solución, construida con más de 30 servicios de AWS incluyendo su aplicación Search Maker, es capaz de filtrar cada uno de esos documentos según su fecha de publicación y país de origen, visualizando las conclusiones en mapas y gráficos para detallar las tendencias y patrones de nuestra nueva -si es que alguna vez hubo una definitiva- forma de hablar.

Evitar el analfabetismo digital

En la presentación de esta tecnología, en la que participó Miguel Álava, director general de AWS en España y Portugal, el director de la RAE se reafirmó en sus duros comentarios sobre los peligros del habla informal en internet que expresó hace unos meses, durante el anuncio de un acuerdo similar con Microsoft.

Santiago Muñoz Machado reconoció estar en un “momento refundacional del cuidado del idioma, provocado por la gran revolución digital y de la IA en particular”. Y fue más lejos: “Los humanos, hasta ahora, sabían que si no seguían las normas de la RAE pasaban al grupo de los analfabetos. Tenemos que asegurarnos de que siga siendo así y hacerles entender eso también a las máquinas”.

A su vez, Carme Artigas -secretaria de Estado de Digitalización e Inteligencia Artificial- recordó la importante apuesta del Ejecutivo en la particular confluencia de tecnología y lengua. No hizo referencia únicamente a la contribución de cinco millones de euros al proyecto LEIA que comanda la misma RAE, sino a los 1.100 millones destinados al PERTE del español, de los que 100 millones se han previsto ya para desarrollar un corpus sobre el que entrenar algoritmos y otros 200 millones para impulsar la industria de la IA en español.

“La lengua no solo es una herramienta transaccional, sino que es algo que nos permite crear un mapa del mundo”, explicaba la secretaria de Estado. “Por eso es un activo económico y estratégico, que nos ha llevado a que el PERTE de la lengua sea el único transversal y que se apoya en una lengua en plena expansión y crecimiento”.