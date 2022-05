Mitad meme, mitad herramienta usada por millones de usuarios en España y en el resto del mundo. Por supuesto, hablamos de Google Translate o el traductor de Google. Un software que permite traducir cualquier frase o palabra entre idiomas y que ha facilitado enormemente el superar la barrera lingüística existente entre usuarios de todo el mundo. Ahora, el traductor de Google vuelve a mejorar, esta vez soportando 24 idiomas nuevos, en el contexto del Google I/O.

Google ha anunciado que actualiza su traductor añadiendo soporte para más de 20 idiomas adicionales. Hasta el momento, el traductor soportaba 108 idiomas, y sumándole la cifra de 24 que Google añade hoy, se queda en 133 dialectos. Y no son en absoluto idiomas que no se hablen, ni muchísimo menos.

De hecho, tal y como expone la propia Google en su blog, estos idiomas son hablados por más de 300 millones de personas. Además, estos lenguajes se quedan con el logro de ser los primeros agregados usando un sistema de aprendizaje automático llamado Zero-Shot.

Nuevos 24 idiomas

Entre los idiomas soportados por el traductor de Google, se añaden por ejemplo el lingala, usado por más de 45 millones de personas en África Central, así como el mizo, que se usa en el noroeste de la India y que lo usan 800.000 usuarios. Por si fuera poco, varias de las lenguas indígenas de América como el guaraní, el aimara o el quechua ya están presentes en el traductor.

Según detalla Google en su artículo, estos son los primeros idiomas que se han añadido al software de traducción usando la traducción automática Zero-Shot. En este, un modelo de aprendizaje automático solo ve texto monolingüe, o lo que es lo mismo, aprende a traducir a otro idioma sin haber visto ejemplos anteriormente. Estos son los 24 idiomas en total:

Assamese

Aimara

Bambara

Bhojpuri

Dhivehi

Dogri

Ewe

Guaraní

Ilocano

Konkani

Krio

Kurdo (soraní)

Lingala

Luganda

Maithili

Meiteilon (manipuri)

Mizo

Oromo

Quechua

Sánscrito

Sepedi

Tigrinya

Tsonga

Twi

Hay que aclarar que el hecho de que se haya usado Zero-Shot para incluir estos idiomas, no lo exime de sus errores, ya que esta técnica no es perfecta. Google explica que deben seguir mejorando los modelos que traen estos idiomas al traductor de Google debido a que no son en absoluto infalibles.

Pero ¿por qué 133? Google además ha añadido un dialecto del inglés, krio de Sierra Leona. Este idioma se ha agregado por primera vez al traductor, permitiendo que sus hablantes puedan introducirlo en la herramienta.

