Publicada

Varapalo para Anthropic. En la misma semana que ha lanzado al mercado los modelos de inteligencia artificial más potentes de Occidente, Claude Fable 5 y Mythos 5, el gobierno de EEUU ha ordenado suspender todo acceso a ellas a cualquier ciudadano extranjero por motivos de seguridad nacional.

No importa si un usuario está dentro o fuera de los Estados Unidos, no podrán tener acceso a esta inteligencia artificial —incluyendo los empleados extranjeros de Anthropic—, por lo que la empresa los ha desactivado de forma inmediata para todos sus clientes a fin de garantizar el cumplimiento. El acceso a los demás modelos de Anthropic no se verá afectado.



Esta medida llega también sólo unos días después de que Dario Amodei, CEO de Anthropic, hiciese un llamamiento para guiar a los gobiernos a poner medidas que frenen el posible avance de inteligencias artificiales extremadamente potentes, con el fin de evitar múltiples amenazas que están por llegar. Dicho y hecho.

"Recibimos la directiva del gobierno a las 17:21 horas (hora del este). La carta no proporcionaba detalles específicos sobre su preocupación por la seguridad nacional. Entendemos que el gobierno cree haber descubierto un método para eludir, o "desbloquear", Fable 5. Revisamos una demostración de esta técnica específica utilizada para identificar algunas vulnerabilidades menores previamente conocidas. Estas vulnerabilidades parecen relativamente sencillas, y hemos comprobado que otros modelos disponibles públicamente también pueden detectarlas sin necesidad de un método alternativo", explica la compañía en un comunicado.

La compañía defiende que "hemos implementado sólidas medidas de seguridad que reducen considerablemente la probabilidad de que Fable se utilice indebidamente para tareas relacionadas con la ciberseguridad (entre otras). De hecho, nuestras medidas son tan robustas que muchos usuarios se han quejado de que son excesivamente amplias".

Lo cierto es que Anthropic, antes de lanzar al público Fable 5 y Mythos 5, colaboró con el gobierno de EEUU, la AISI del Reino Unido y diversas organizaciones privadas externas y equipos internos para realizar pruebas de penetración (red teaming) a las medidas de seguridad "durante miles de horas en total".

Es por ello que Anthropic asegura que no entiende la decisión tomada por el gobierno de Trump, debido a que "si el hallazgo de una posible vulnerabilidad limitada es el motivo para retirar un modelo comercial implementado para cientos de millones de personas, un criterio que se aplicara a toda la industria, creemos que paralizaría prácticamente todas las implementaciones de nuevos modelos para todos los proveedores de modelos de vanguardia".

Tras la petición de regulación

La medida tomada por el gobierno de EEUU llega días después de que el propio Amodei emitiese una serie de propuestas para regular el poder de esta nueva tecnología y cuya repercusión aún no se conoce con certeza.

Y es que sucede que mientras que la ley siempre se toma su tiempo para analizar y tomar decisiones importantes como la creación de normativas que afectan a miles de personas, choca con el ritmo de vorágine acelerada del avance de la inteligencia artificial.

Ya en 2023 muchas figuras públicas y expertos en la materia pidieron frenar el desarrollo de esta revolución hasta conocer cómo desarrollarla de forma segura.

“Son los mismos; Amodei estaba entre los que pedía parar el desarrollo de la IA en 2023", recuerda Antonio Pita, Profesor de los Estudios de Informática, Multimedia y Telecomunicación de la UOC, en una entrevista con EL ESPAÑOL-Omicrono.

Sam Altman, ya pidió en 2023 como líder de OpenAI (rival de Anthropic), la regulación de la IA. Pero días después amenazó a la UE con bloquear ChatGPT si la regulación era demasiado estricta.

Las empresas tecnológicas, sobre todo las desarrolladoras de potentes modelos de IA, se están acostumbrando a dar su opinión en política y cómo deben las autoridades regular o usar sus poderosos algoritmos. Hace solo un mes Palantir defendía en un incendiario manifiesto una autocracia digital, y exigía "defender Occidente con industria militar basada en IA".

Sam Altman (centro) y Dario Amodei (der) se niegan a darse la mano durante la Cumbre de Impacto de la IA en India Reuters El Androide Libre

Para Antonio Pita, la propuesta de Anthropic es obvia dentro del sector, donde ya hay muchos expertos estudiando desde hace años los riesgos y formas de evitarlos.

"De cara al gran público sí es un golpe de efecto", explica. Esta publicación llega cuando Anthropic ha presentado recientemente su salida a bolsa, le han seguido SpaceX de Elon Musk y OpenAI de Sam Altman. "Es positivo, pero con todas las salidas a bolsa, vamos a ver muchas acciones de marketing", aclara este experto en IA de la UOC.

De ciberataques a pandemias

La primera propuesta de Anthropic es una hoja de ruta sobre las medidas que se deben adoptar por parte de las autoridades gubernamentales para bloquear o disuadir de posibles implementaciones peligrosas. La segunda aborda cómo preparar a los trabajadores y a la economía para el impacto de la IA, ante los despidos masivos que se esperan en adelante.

El crecimiento de las capacidades de los modelos de IA ha sido fugaz en los últimos años, como recuerda la empresa: "Todo apunta a que esta tendencia continuará, y con ella, el riesgo de daños catastróficos también aumentará".

Anthropic plantea tres importantes peligros: biológico, cibernético, descontrol e investigación automatizada.

Restringe esta posible nueva regulación a la implementación de los modelos más grandes, aquellos entrenados con más de 10²⁵ operaciones de punto flotante (FLOPs), desarrollados por empresas que generen más de 500 millones de dólares en ingresos relacionados con la IA o que inviertan más de 1.000 millones de dólares en I+D de IA.

Fotomontaje con el logo de Anthropic. Manuel Fernández Anthropic

Un buen ejemplo de modelo capaz de provocar todos estos riesgos, sería Claude Mythos, desarrollado por esta empresa. Por sus altas capacidades, la compañía limitó su acceso a un reducido número de clientes y ahora lo ha abierto, renombrado como Fable 5.

Para continuar con su compromiso con la seguridad, la empresa dijo que redireccionaría a los usuarios que hicieran preguntas sobre ciberseguridad, biología o química hacia un modelo de IA menos capaz.

Sin embargo, otra de las restricciones aplicadas ha generado más polémica. Para investigadores que intentaban usar Claude Fable 5 para el desarrollo de nuevos modelos de IA, Anthropic decidió degradar deliberadamente el desempeño del modelo de manera invisible para el usuario.

Ante las críticas de "sabotaje", Anthropic ha rectificado y ahora, si se sospecha que un usuario intenta usar Claude para construir una IA altamente capaz, lo alertará de que está rechazando la solicitud o redireccionando al usuario hacia un modelo menos capaz.

Transparencia y evaluación externa

Estas medidas tomadas para Mythos o Fable 5, ponen de ejemplo la postura de Anthropic. Tanto Dario Amodei en su blog como el comunicado de Anthropic afirman que esta situación exige la intervención y regulación gubernamental, pero añade que las medidas deben diseñarse con cuidado para prevenir la extralimitación gubernamental y proteger la innovación.

En Europa ya lo tenemos regulado, y se ha hecho muy bien porque se ha puesto el foco en los casos de uso: Tú investiga, desarrolla, o haz lo que tú quieras", detalla Antonio Pita.

"Ahora, cuando lo vayas a poner en funcionamiento, cuando eso tenga un impacto real en alguien, entonces tenemos que analizarlo bien. Si está en un nivel alto se requieren de unos mecanismos, primero de control interno y después por el supervisor".

Dario Amodei, CEO de Anthropic, durante la Cumbre de Impacto de la IA en India Reuters El Androide Libre

La empresa estadounidense menciona como primera solución la transparencia. Plantean que los desarrolladores de estos grandes modelos publiquen resúmenes de los resultados y pruebas realizados, así como una evaluación de los posibles riesgos y capacidades del modelo.

Menciona también la necesidad de una figura independiente, un evaluador que certifique la tecnología, como la FAA (Administración Federal de Aviación) regula desde aviones a cohetes.

Una simple búsqueda en internet muestra una amplia lista de organismos que ejercen como evaluadores: el AI Security Institute del Reino Unido, el Instituto de Estándares y Tecnología de EEUU (NIST) y la Agencia Española de Supervisión de Inteligencia Artificial (AESIA), con sede en A Coruña.

Pita menciona "el Instituto Tecnológico de Massachusetts (MIT) que tiene una iniciativa desde hace muchos años donde se dedican a analizar todos los posibles riesgos”. El MIT cuenta con un listado de riesgos y calculan la probabilidad de que se produzcan o no en base a entrevistas que hacen con altos ejecutivos de compañías.

Este experto en IA aclara que el riesgo sigue latente, aunque la comunidad estudie cada modelo y posibles consecuencias, incluso con la Unión Europea siendo pionera en legislación y con potencias como China que también han avanzado en esta materia. Estados Unidos estaría un poco más rezagado.

Sin embargo, "la ciberdelincuencia está prohibida, pero sigue ocurriendo”, muchas veces con el apoyo y financiación de los propios estados y gobiernos "no cualquiera puede hacer estas acciones, incluso con inteligencia artificial se requiere tener mucho capital", añade.

La evolución de esta nueva revolución sigue presentando muchas incógnitas a las que resulta difícil anticiparse y más para los ritmos burocráticos.

“Puede que llegue un momento, quizás relativamente pronto, en que tengamos que ir más allá, (...) que necesitemos medidas regulatorias más agresivas que las que he expuesto”, concluye Dario Amodei en su publicación personal."