Anthropic dice que sí desactivando dos modelos de IA que lanzó a principios de esta semana, Claude Fable 5 y Mythos 5, para cumplir con una directiva de control de exportaciones que recibió el viernes por la tarde del gobierno estadounidense citando problemas de seguridad nacional.
El incidente sin precedentes marca el último punto de fuego entre Anthropic y la administración de Trump. Aunque la empresa dice que la orden le pedía suspender el acceso a "cualquier nacional extranjero, ya sea dentro o fuera de Estados Unidos, incluidos los empleados antrópicos extranjeros", suprimió el acceso a todos sus clientes para garantizar el cumplimiento.
A principios de este año, el Departamento de Defensa de Trump calificó a Anthropic de "riesgo de la cadena de suministro" después de que el fabricante de Claude intentara dibujar líneas rojas sobre cómo el ejército estadounidense podría utilizar su tecnología. La designación prohibió efectivamente a las agencias gubernamentales y contratistas el uso de la tecnología de Anthropic. Anthropic respondió presentando demandas contra la administración Trump.
El martes, Anthropic publicó públicamente Claude Fable 5, una versión del modelo de IA Mythos de la empresa con garantías que impiden que responda a preguntas sobre ciberseguridad, biología y química. Antes del lanzamiento público, que Anthropic dijo haber llevado a cabo en colaboración con el gobierno de EE.UU., el modelo de IA de Mythos Preview tuvo un lanzamiento limitado en abril. El objetivo era dar a las empresas y organizaciones la oportunidad de utilizar sus potentes capacidades de ciberseguridad para mejorar sus defensas y evitar la preocupación de que los malos actores pudieran aprovechar la tecnología para desarrollar herramientas de piratería potentes.
En una publicación en el blog del viernes, Anthropic dice que recibió una carta del gobierno de EE.UU. a las 5:21 pm ET. "La carta no proporcionó detalles específicos de su preocupación de seguridad nacional", escribió Anthropic.
"Nuestro entendimiento es que el gobierno cree que se ha dado cuenta de un método para pasar por alto, o 'jailbreak' de Fable 5", añadió la compañía. "Hemos revisado una demostración de esta técnica específica que se utiliza para identificar un número reducido de menores vulnerabilidades conocidas anteriormente. Todas estas vulnerabilidades parecen relativamente sencillas y hemos descubierto que otros modelos disponibles públicamente también son capaces de descubrirlas sin requerir un bypass".
En la publicación del blog, la compañía argumentó que ha implementado fuertes salvaguardias para reducir la probabilidad de un mal uso de Claude Fable 5. Anthropic también afirmó que el jailbreak que el gobierno estadounidense encontró para Claude Fable 5 era estrecho y no habría hecho que un atacante fuera significativamente más peligroso de lo que habría sido con otro modelo de IA.
"Hasta ahora, el gobierno sólo nos ha dado pruebas verbales de una posible fuga de prisión estrecha y no universal, que consiste esencialmente en pedir al modelo que lea una base de código específica y que solucione cualquier fallo del software", dijo la compañía a su publicación en el blog. "Nuestro entendimiento es que un posible jailbreak se compartió con el gobierno".
Los portavoces de la Casa Blanca y del Departamento de Comercio de Estados Unidos no respondieron de inmediato a la solicitud de comentarios de WIRED.
El consejero delegado de Anthropic, Dario Amodei, dijo en un ensayo político a principios de esta semana que él y la compañía apoyan un proceso gubernamental justo, estructurado y transparente que bloquearía el lanzamiento de modelos de IA inseguros. En la publicación del blog de la empresa el viernes, Anthropic argumentó que "esta acción no se adhiere a estos principios".

Deja una respuesta