La advertencia de seguridad de Anthropic puede haber resultado contraproducente: el gobierno cerró su IA más poderosa

El gobierno de Estados Unidos ordenó el viernes a Anthropic bloquear inmediatamente el acceso a dos de sus modelos de inteligencia artificial más poderosos, Claude Fable 5 y Claude Mythos 5, citando preocupaciones de seguridad nacional. Anthropic anunció que había cumplido con X, pero el gobierno ha dejado claro que cree que fue un error.

La directiva, que Anthropic anunció el viernes a las 5:21 p.m. ET, obliga a la compañía a desactivar ambos modelos para todos los usuarios en todo el mundo, no solo para los extranjeros que nominalmente son el objetivo de la orden de control de exportaciones del gobierno. El acceso a otros modelos de Anthropic no se ve afectado.

¿Por qué esto importa? Mythos es el modelo de IA más capaz de Anthropic, el que la compañía presentó a principios de abril, pero desde entonces se ha visto severamente limitado por lo que Anthropic describió como su extraordinaria capacidad para descubrir vulnerabilidades de seguridad en el software. Según Anthropic, Mythos identificó la falla en todos los principales sistemas operativos y navegadores web que probó, por lo que, en lugar de revelarla públicamente, lanzó un programa moderado llamado Proyecto Glasswing para compartir con unas 50 organizaciones examinadas, incluidas Amazon, Apple, Google, Microsoft y CrowdStrike, para utilizarlo en trabajos de ciberseguridad defensiva.

Lanzado hace apenas tres días, Fable 5 fue la respuesta de Anthropic a las obvias presiones comerciales. La compañía afirmó que era una versión de Mythos con barreras de seguridad para bloquear respuestas en áreas de alto riesgo como la ciberseguridad y la biología, lo que lo hacía lo suficientemente seguro para su divulgación general. Las pruebas de referencia de Vals AI, una empresa que rastrea el rendimiento de la tecnología de IA, descubrieron rápidamente que era el modelo de IA de mayor rendimiento disponible para el público.

La directiva gubernamental se posiciona como una medida de control de exportaciones y limita el acceso de los extranjeros a los modelos. Sin embargo, Anthropic dijo en una extensa publicación de blog que entiende que la preocupación subyacente es el supuesto jailbreak de Fable 5. Hasta ahora, el gobierno sólo ha proporcionado evidencia verbal de una «potencial fuga limitada y no universal», dijo la compañía. Como explica Anthropic, solicita al modelo que lea una base de código específica para identificar fallas en el software. Por cierto, la compañía añade que se trata de un «nivel de funcionalidad» que ya está ampliamente disponible en otros modelos de acceso público, como el GPT-5.5 de OpenAI. Anthropic dice que los expertos en ciberseguridad también lo utilizan habitualmente con fines defensivos.

El argumento más amplio de Anthropic es que sus salvaguardas más fuertes funcionan a través de un sistema clasificador independiente que opera por separado del modelo en sí, lo que significa que incluso si alguien convenciera a Fable de seguir hablando sobre el rechazo, la protección fundamental contra los resultados más peligrosos permanecería.

Claramente, nada de esto es suficiente para impedir que el gobierno tome medidas, y Anthropic no ha ocultado su descontento. «No estamos de acuerdo en que el descubrimiento de una estrecha posibilidad de jailbreak deba ser motivo para retirar un modelo comercial que se ha implementado a cientos de millones de personas», escribió la compañía. «Si este estándar se aplicara en toda la industria, creemos que efectivamente detendría el lanzamiento de todos los modelos nuevos a todos los proveedores de modelos Frontier».

Se espera ampliamente que Anthropic busque una oferta pública inicial (IPO) este año, apostando gran parte de su identidad pública a ser una alternativa a sus rivales centrada en la seguridad. Los observadores no perciben la ironía de que la extrema cautela de Anthropic al restringir Mythos, que promovió como un modelo demasiado peligroso para divulgarlo públicamente, ahora parece estar invitando al escrutinio gubernamental que más podría perturbar su negocio.

Sam Altman de OpenAI al menos debe estar divirtiéndose con esto. En abril, le dijo a la presentadora de podcast Ashley Vance que el tratamiento que Anthropic le dio a Mythos equivalía a un «marketing basado en el miedo». «Obviamente es un marketing increíble decir: ‘Construimos una bomba, estábamos a punto de arrojarla sobre tu cabeza y te vamos a vender un refugio antiaéreo por 100 millones de dólares'», dijo Altman. Altman, cuya empresa también se espera que busque una oferta pública inicial lo antes posible, no predijo un cierre del gobierno, pero señaló que hasta ahora ha vuelto a perjudicar a Anthropic. Eso significa que si pasas meses diciéndole al mundo que tu IA es especialmente peligrosa, es más probable que el mundo, incluido el gobierno de Estados Unidos, te escuche.

Si compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta la independencia editorial.

Source link

What's Hot

Cómo Europa está pasando de la extinción de incendios a la resiliencia al fuego

Microsoft anuncia un nuevo modelo de IA de ciberseguridad que permite a MDASH alcanzar el 95,95% a la mitad del costo

Los atacantes aprovechan la falla de inyección de comandos en Arista VeloCloud Orchestrator

La advertencia de seguridad de Anthropic puede haber resultado contraproducente: el gobierno cerró su IA más poderosa

Microsoft presenta el primer modelo de ciberseguridad y un nuevo sistema de ciberseguridad para agentes

La violación de Hugging Face de OpenAI reaviva el debate sobre coordinación y control

Los usuarios de hilos ahora pueden chatear con Meta AI en mensajes directos

Cómo Europa está pasando de la extinción de incendios a la resiliencia al fuego

Microsoft anuncia un nuevo modelo de IA de ciberseguridad que permite a MDASH alcanzar el 95,95% a la mitad del costo

Los atacantes aprovechan la falla de inyección de comandos en Arista VeloCloud Orchestrator

Microsoft presenta el primer modelo de ciberseguridad y un nuevo sistema de ciberseguridad para agentes

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

What's Hot

La advertencia de seguridad de Anthropic puede haber resultado contraproducente: el gobierno cerró su IA más poderosa

Related Posts