Tras dos años de desarrollo, el LLM desarrollado en América Latina y el Caribe se presenta oficialmente.

Tras dos años de desarrollo, el LLM desarrollado en América Latina y el Caribe se presenta oficialmente. CENIA.

Disruptores Américas

Latam GPT se hace realidad: un modelo de lenguaje abierto y colaborativo, resultado de la alianza de 15 países

Rodrigo Durán, director Ejecutivo del Centro Nacional de Inteligencia Artificial (CENIA) afirma que el objetivo es que este modelo “sea un activo estratégico resiliente y útil, más allá de los ciclos de gobierno”.

Más información: Latam GPT, la IA hecha por y para Latinoamérica para que la región tenga voz propia en el mapa global de la innovación

Publicada

Las claves

Latam GPT es el primer modelo de lenguaje abierto y colaborativo desarrollado por y para América Latina y el Caribe, fruto de la alianza de 15 países.

El modelo incorpora datos, contextos y matices culturales latinoamericanos, buscando superar la brecha histórica causada por el sesgo anglosajón en los sistemas de IA.

Latam GPT prioriza la integración de lenguas indígenas en futuras versiones y su desarrollo está liderado por el Centro Nacional de Inteligencia Artificial (CENIA) de Chile.

El proyecto es considerado un bien público regional, con una gobernanza que involucra al ámbito académico, estatal y privado, garantizando autonomía y resiliencia tecnológica.

Lo que comenzó como una idea hoy es una realidad y un hito en la relación de América Latina con la inteligencia artificial (IA). Tras más de dos años de desarrollo, por fin se ha presentado oficialmente Latam GPT, el modelo LLM hecho por y para América Latina y el Caribe.

"La inteligencia artificial es la mayor revolución tecnológica del último tiempo y desde Latinoamérica y el Caribe es estratégico y urgente que tengamos un rol. Hoy desde Chile lanzamos Latam-GPT, un modelo de lenguaje abierto y colaborativo, resultado de una alianza con 15 países, que permitirá incluir datos e identidad latinoamericana en nuestra interacción con la IA. Soberanía tecnológica y cultural para que nuestra región sea parte de esta conversación global", afirmaba el presidente chileno Gabriel Boric durante el acto de presentación.

Un modelo que, como señalaba Gabriel Boric, ha ido ganando la confianza de países de América Latina como México, Colombia, Brasil, Panamá, Costa Rica, Ecuador y Uruguay que poco a poco se iban sumando al proyecto liderado por el Centro Nacional de Inteligencia Artificial (CENIA) de Chile.

Latam-GPT, afirman desde el Gobierno de Chile, representa un avance relevante para la región al proponer un modelo de Inteligencia Artificial (IA) construido con idiomas, datos y contextos propios de América Latina y el Caribe, “desarrollado por talento regional para la región”.

Así y “a diferencia de los modelos entrenados principalmente con información en inglés y marcos culturales del Norte Global, Latam-GPT comprende los matices culturales, lingüísticos y los contextos históricos y políticos latinoamericanos”.

Esa es la principal ambición de Latam-GPT, romper lo que sus creadores califican de “una brecha histórica en el desarrollo de modelos de lenguaje a nivel global”.

No en vano, según estimaciones basadas en repositorios abiertos como Common Crawl, los datos en español y portugués representan, respectivamente, apenas cerca del 4% y el 2% del total utilizado para entrenar este tipo de sistemas.

En ese sentido, el modelo está construido sobre Llama 3.1 de 70.000 millones de parámetros, algo que Rodrigo Durán, director Ejecutivo del Centro Nacional de Inteligencia Artificial (CENIA), en conversación con DISRUPTORES AMERICAS considera que ofrece como ventaja el contexto profundo.

“Al inyectar 300B de tokens mediante Continual Pre-training, Latam-GPT reduce el sesgo anglo céntrico” y añade que “mientras modelos globales alucinan sobre leyes o modismos locales, nuestra curaduría con LLM-as-a-judge asegura precisión en giros idiomáticos y realidades socioeconómicas regionales”.

Rodrigo Durán, director ejecutivo del director ejecutivo del Centro Nacional de Inteligencia Artificial de Chile.

Rodrigo Durán, director ejecutivo del director ejecutivo del Centro Nacional de Inteligencia Artificial de Chile. CENIA

No dejar fuera las lenguas indígenas es otro de los objetivos que han guiado el desarrollo de Latam-GPT y así Rodrigo Durán afirma que esa integración “es una prioridad ética y técnica” pero que comenzará según avance el proyecto. “Trabajamos en recolectar datos representativos para evitar la "folclorización". Creo que el éxito de Latam-GPT se medirá por su capacidad de no dejar a nadie atrás, integrando nuestra diversidad lingüística de forma estructural en las futuras versiones”, explica.

El modelo ha sido concebido como “un bien público regional orientado a democratizar el acceso a esta tecnología y habilitar su uso en ámbitos estratégicos como educación, gestión pública e innovación productiva”.

Gobernanza y soberanía

El carácter de "bien público" de Latam GPT marcará también su gestión ya que, como aclara Rodrigo Durán, aunque el liderazgo técnico es de CENIA “la visión es una gobernanza multiactor. Al articular el ámbito académico, el Estado y las entidades privadas, las decisiones estratégicas se despolitizan. Propiciamos un modelo de gestión regional similar a grandes infraestructuras científicas, donde la evolución del modelo dependa de un comité de expertos y la retroalimentación de los sectores productivos”. Un enfoque que, en su opinión, garantiza que Latam-GPT “sea un activo estratégico resiliente y útil, más allá de los ciclos de gobierno”.

El desarrollo del “primer Gran Modelo de Lenguaje” abierto de la región está apoyando tecnológicamente por compañías como AMD o Amazon Web Services (AWS) algo que no resta soberanía tecnológica al proyecto, en opinión del director ejecutivo del CENIA: “La soberanía hoy no es solo propiedad del hardware sino autonomía en la ingeniería".

Y añade que "haber entrenado un modelo de esta escala nos da el know-how para migrar entre infraestructuras. AWS o AMD son habilitadores; la soberanía reside en que los pesos, el datamix y la arquitectura (como la Strassen Attention) son regionales. Esto permite auditar la "caja negra" y no depender de APIs externas cerradas que pueden cambiar condiciones o sesgos arbitrariamente desde el extranjero”.

El proyecto, afirman desde el CENIA, posiciona a América Latina y el Caribe no solo como usuarios de tecnología de vanguardia, sino como desarrolladores de ella. “No buscamos "vencer" a competidores globales en su terreno, sino dotar a la región de una infraestructura pública digital robusta. Complementar, no competir. Queremos que América Latina y el Caribe se siente en la mesa de la IA con voz propia. Al consolidarnos como el backbone regional, permitimos que startups y estados desarrollen soluciones soberanas. El éxito global vendrá por la calidad de nuestra ingeniería y el conocimiento que podamos generar”, asegura Rodrigo Durán.