La controversia de Anthropic: el gobierno bloquea su IA más potente por seguridad
Anthropic, la empresa de IA, recibió una orden del gobierno para desactivar su modelo Claude Fable 5, tras preocupaciones de seguridad nacional. La compañía expresó su desacuerdo y destacó que la medida afecta a millones de usuarios.
El gobierno de EE.UU. ordenó a Anthropic desactivar de inmediato el acceso a sus modelos de inteligencia artificial más avanzados, Claude Fable 5 y Claude Mythos 5, citando preocupaciones de seguridad nacional. La compañía, frustrada por la decisión, anunció su cumplimiento pero dejó claro que no estaba de acuerdo con la medida.
Según Anthropic, la notificación se recibió el viernes a las 5:21 p.m. ET, y obliga a la empresa a desactivar ambos modelos para todos los usuarios a nivel mundial, no solo para los extranjeros a quienes estaba dirigida la orden de control de exportaciones. Sin embargo, el acceso a otros modelos de Anthropic no se verá afectado.
La importancia de esta decisión radica en que Mythos es considerado el modelo de IA más capaz de Anthropic. Este modelo fue presentado en abril y, debido a su capacidad para identificar vulnerabilidades de seguridad en software, la empresa decidió mantenerlo restringido a un grupo de 50 organizaciones seleccionadas, incluyendo Amazon, Apple, Google, Microsoft y CrowdStrike, para su uso en trabajos de ciberseguridad defensiva.
Por su parte, Fable 5, lanzado apenas tres días antes de la orden, se había diseñado como una versión más segura de Mythos, con restricciones que impiden respuestas en áreas de alto riesgo como la ciberseguridad y la biología. Según pruebas de rendimiento, Fable 5 se convirtió rápidamente en el modelo de IA más potente disponible públicamente.
La directiva del gobierno se presenta como una acción de control de exportaciones, restringiendo el acceso a los modelos para los extranjeros. Sin embargo, Anthropic argumentó en un extenso comunicado que la preocupación principal es un supuesto jailbreak de Fable 5. Hasta ahora, la empresa indicó que el gobierno solo ha proporcionado evidencia verbal de un "potencial jailbreak estrecho y no universal", que consiste en instar al modelo a leer un código específico y detectar fallos de software. Anthropic destacó que esta capacidad ya está disponible en otros modelos accesibles públicamente, incluyendo el GPT-5.5 de OpenAI.
La compañía argumentó que sus salvaguardias más robustas operan a través de sistemas de clasificador independientes que funcionan separadamente del modelo en sí, lo que significa que incluso si alguien logra que Fable continúe respondiendo tras un rechazo, las protecciones subyacentes contra los resultados más peligrosos permanecen intactas.
La ironía de esta situación no se ha perdido en los observadores, ya que Anthropic se había posicionado como una alternativa consciente de la seguridad frente a sus competidores, y ahora se enfrenta a un escrutinio gubernamental que podría afectar su negocio de manera significativa. Sam Altman, de OpenAI, comentó en abril que la gestión de Mythos por parte de Anthropic era una forma de "marketing basado en el miedo". La declaración de Anthropic muestra que, al advertir al mundo sobre su IA como potencialmente peligrosa, el gobierno de EE.UU. ha respondido de manera contundente.
Lectura rápida
¿Qué ordenó el gobierno de EE.UU. a Anthropic?
Desactivar el acceso a sus modelos de IA más potentes, Claude Fable 5 y Claude Mythos 5.
¿Por qué se tomó esta decisión?
Por preocupaciones de seguridad nacional y un supuesto jailbreak del modelo Fable 5.
¿Qué es Mythos?
Es el modelo más capaz de Anthropic, diseñado para detectar vulnerabilidades de seguridad en software.
¿Qué impacto tiene esta decisión?
Afecta a millones de usuarios, ya que se desactiva el acceso a estos modelos a nivel mundial.
¿Cómo responde Anthropic a la orden?
La empresa expresó su desacuerdo y destacó que la medida podría frenar el despliegue de nuevos modelos en la industria.





