La competencia entre empresas desarrolladoras de IA es extrema, hasta el punto de acusarse de robar información o IA de los rivales. La tensión se siente especialmente entre Estados Unidos y China, entre gigantes como OpenAI y competidores como DeepSeek, el modelo open source que sorprendió a medio mundo el año pasado.
OpenAI ha presentado un memorando a los legisladores estadounidenses en el que acusa a la startup china responsable de DeepSeek de replicar sus modelos de lenguaje natural, la base de los chatbots, para el entrenamiento de su propia inteligencia artificial.
Según informa Reuters, la empresa dirigida por Sam Altman acusa a DeepSeek de realizar "esfuerzos constantes para aprovecharse de las capacidades desarrolladas por OpenAI y los laboratorios fronterizos de Estados Unidos".
En concreto, los responsables de ChatGPT hablan de la técnica de destilación. Este método implica utilizar un modelo de IA más antiguo, cuyo uso y entrenamiento le han conferido más estabilidad y capacidad de respuesta.
El modelo veterano se encarga de evaluar la calidad de respuestas que ofrece el modelo de lenguaje natural más nuevo, transfiriendo los aprendizajes de uno a otro. Una metodología que puede recordar al aprendizaje de los humanos.
En el memorando enviado el jueves al Comité Selecto de la Cámara de Representantes de EEUU sobre Competencia Estratégica entre EEUU y el Partido Comunista Chino, OpenAI dijo: "Hemos observado cuentas asociadas con empleados de DeepSeek que desarrollan métodos para eludir las restricciones de acceso y los modelos de acceso de OpenAI a través de enrutadores de terceros ofuscados y otras formas que enmascaran su fuente".
OpenAI afirma que elimina de forma proactiva a los usuarios que parecen estar intentando destilar sus modelos para desarrollar otros para sus rivales en esta frenética carrera tecnológica.
DeepSeek
"También sabemos que los empleados de DeepSeek desarrollaron un código para acceder a los modelos de inteligencia artificial de EEUU y obtener resultados para su destilación de manera programática", agregó el memorando.
Al ser un modelo de código abierto, DeepSeek AI permite que investigadores, desarrolladores y empresas de todo el mundo puedan utilizar, estudiar y modificar libremente su código. Esta filosofía contrasta con los modelos "cerrados" de grandes corporaciones como OpenAI, democratizando el acceso a la inteligencia artificial de última generación, y dándole a China una ventaja importante.
Los ejecutivos de Silicon Valley han elogiado anteriormente los modelos denominados DeepSeek-V3 y DeepSeek-R1, que están disponibles a nivel mundial. Aún así, ahora OpenAI afirma que los grandes modelos lingüísticos chinos están "tomando atajos activamente cuando se trata de entrenar e implementar de forma segura nuevos modelos".
En septiembre del año pasado este proyecto chino anunció un nuevo modelo llamado DeepSeek-V3.2-Exp que prometía un cambio en la forma de entrenar este tipo de IAs. DeepSeek Sparse Attention es un mecanismo de atención difusa diseñado para explorar y validar optimizaciones para la capacitación y la eficiencia de inferencia en escenarios de contexto largo.
Es decir, cuando el modelo ha de ser entrenado, es capaz de validar por sí mismo ciertos parámetros, que hacen que el proceso sea mucho más eficaz. En vez de centrarse en una sola "línea de pensamiento", DeepSeek 3.2 podrá utilizar varias simultáneamente, con lo que la fiabilidad debería verse aumentada.
