Placa de plomo con inscripciones en idioma ibérico

Placa de plomo con inscripciones en idioma ibérico Pguerin | Wikimeida Commons Omicrono

Software

Esta inteligencia artificial estudia el íbero y aleja su origen del vasco

Investigadores del MIT han desarrollado una IA capaz de descifrar y comprender lenguas muertas como el idioma íbero, sin necesidad de tener conocimientos de otros.

27 octubre, 2020 02:15

Noticias relacionadas

El uso de Inteligencia Artificial (IA) cada vez está más extendido en países como España para todo tipo de tareas, como crear el sushi perfecto o responder a nuestras preguntas. Aunque no todas sus aplicaciones tienen una utilidad directa.

Sin embargo, la IA también se puede usar para otros motivos más académicos, como han demostrado investigadores del Instituto Tecnológico de Massachusetts (MIT). Investigadores del reputado instituto norteamericano han conseguido crear un sistema capaz de descifrar lenguas muertas de manera automática, y sin que el usuario tenga que hacer nada u ofrecer algo de contexto.

Con este sistema inteligente, sería posible descubrir la relación entre los idiomas modernos y los que se perdieron para siempre o no son usados en el día a día. Los lenguajes perdidos son más que una mera curiosidad académica; sin ellos, también desaparece el conocimiento sobre las personas que los hablaron. 

Lee lenguas muertas

Lamentablemente, la mayoría de las lenguas muertas tienen registros tan mínimos que los científicos no pueden descifrarlos utilizando algoritmos de traducción automática como Google Translate. Algunos no tienen un lenguaje 'relativo' bien investigado con el que compararlos y, a menudo, carecen de separación tradicional como los espacios en blanco y la puntuación. 

Lo cierto es que la arqueología ha descubierto muchos idiomas, en forma de registros escritos en roca, papiro u otros métodos, para los que no tiene referencia alguna. En muchos casos, ya hace miles de años que nadie en el planeta habla esos idiomas de culturas perdidas, incluso entre sus sucesores.

Estas lenguas muertas se siguen estudiando, y dependiendo del caso hay quien puede llegar a hablarlas o entenderlas, pero en la mayoría de ocasiones es directamente imposible encontrar la forma directa de saber cómo se leen.

Jeroglíficos egipcios

Jeroglíficos egipcios

Ahora, un desarrollo del MIT busca solucionar esto buscando relaciones entre estas lenguas muertas y las modernas, para comprender mejor cómo evolucionaron a lo largo de las generaciones; eso nos puede ayudar a descifrar esos idiomas perdidos y recuperarlos.

Cómo funciona

Los investigadores del Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL) realizaron recientemente un importante desarrollo en el área de investigación de lenguas muertas. Han dado con un nuevo sistema que ha demostrado ser capaz de descifrar automáticamente lenguajes perdido, sin necesidad de conocimientos avanzados de su relación con otros lenguajes. 

El sistema se basa en varios principios basados en conocimientos de la lingüística histórica, como el hecho de que los idiomas generalmente sólo evolucionan de ciertas formas predecibles. Por ejemplo, si bien un idioma determinado rara vez agrega o elimina un sonido completo, es probable que se produzcan ciertas sustituciones de sonido. "Una palabra con una 'p' en el idioma principal puede cambiar a una 'b' en el idioma descendiente, pero el cambio a una 'k' es menos probable", explican desde el MIT

Al incorporar estas y otras limitaciones lingüísticas, desde el CSAIL desarrollaron un algoritmo de descifrado que puede manejar el vasto espacio de posibles transformaciones y la escasez de una forma de entrada. El algoritmo aprende a incrustar los sonidos del lenguaje no llegan. La idea es capturar patrones pertinentes de cambio de lenguaje y expresarlos como restricciones computacionales. El modelo resultante puede segmentar palabras en un idioma antiguo y asignarlas en un idioma relacionado.

Estudio del íbero

El algoritmo es capaz de registrar palabras y categorizarlas en diferentes tipos, asociándolas con idiomas relacionados; por lo tanto, aunque no es capaz de traducir directamente las muestras, sí que es capaz de aprender de ellas e identificar su origen.

El equipo ha demostrado las posibilidades de esta IA corroborando los últimos descubrimientos del idioma íbero, que era usado en la Península Ibérica entre el 400 y el 300 a.C.

Reproducción de un documento en idioma íbero

Reproducción de un documento en idioma íbero J.M de la osa Papix | Wikimedia Commons Omicrono

El íbero fue la lengua predominante entre los diferentes pueblos que vivían entre lo que hoy es el sur de Francia y el sur de España, hasta la llegada de los romanos; la conquista romana de la península trajo consigo el latín como lengua de uso principal en la zona entre el primer y el segundo siglo d.C.

El íbero y el vasco

Uno de los puntos claves del algoritmo es la capacidad de que el sistema es capaz de trazar la relación que puede haber entre idiomas, y para ponerlo a prueba se basaron en una serie de estudios que sugerían que el íbero y el vasco podrían estar relacionados. 

"El objetivo final del equipo es que el sistema pueda descifrar los idiomas perdidos que han eludido a los lingüistas durante décadas, utilizando solo unos pocos miles de palabras", explican desde el MIT.

Lo cierto es que del íbero aún es un idioma del que se sabe muy poco, y sólo algunas inscripciones han sobrevivido; hay muchas hipótesis sobre su origen y especialmente sobre su final. Por ejemplo, hasta no hace mucho se creía que la lengua vasca provenía del íbero.

Sin embargo, recientes estudios sugieren lo contrario; y la Inteligencia Artificial del MIT lo ha corroborado, indicando que el íbero en realidad no está relacionado con el euskera. El algoritmo fue aplicado sobre las escrituras disponibles de íbero, considerando no solo el vasco sino también otras lenguas como las romances, germánicas, túrquicas y urálicas.

La conclusión a la que llegó es que el vasco y el latín son las más cercanas al idioma íbero, pero siguen siendo demasiado diferentes como para considerar que estén relacionadas. Esta investigación puede demostrar las posibilidades de la IA en este campo.