Anthropic restaura Claude Fable 5 después de que Estados Unidos levantara las restricciones a la exportación relacionadas con el jailbreak

Anthropic vuelve a traer Claude Fable 5 online en todo el mundo. El 30 de junio, el Departamento de Comercio de Estados Unidos levantó las restricciones a las exportaciones que había impuesto a Fabre y su hermano más controlado, Mythos 5, aproximadamente dos semanas y media antes.

Fable 5 regresa a los usuarios el miércoles 1 de julio en Claude.ai, Claude Platform, Claude Code y Claude Cowork.

Los controles de exportación limitan quién puede recibir o utilizar tecnología. La orden del 12 de junio ordenó a Anthropic dejar de vender ambos modelos a ciudadanos extranjeros, incluido el personal no nacional, tanto dentro como fuera de los Estados Unidos.

La regla entró en vigor de inmediato, cerrando ambos modelos para todos porque la empresa no tenía una forma confiable de verificar la nacionalidad de todos los usuarios en tiempo real.

El desencadenante fue un jailbreak, un mensaje que hace que el modelo eluda las reglas de seguridad. Los investigadores de Amazon descubrieron uno en Fable 5. Como explica Anthropic, este mensaje llevó al modelo a señalar varias fallas de software y, en un caso, a escribir código para mostrar cómo se podrían explotar las fallas.

Anthropic restó importancia a los hallazgos. La solicitud también funciona en muchos modelos más débiles, incluido el Claude Opus 4.8, el GPT-5.5 de OpenAI y el Kimi K2.7 de China. La compañía llama al comportamiento alertado un trabajo de seguridad defensiva rutinario en lugar de poderes sobrenaturales ocultos.

El gobierno y los socios que informaron sobre la fuga lo consideraron lo suficientemente grave como para justificar una regulación de emergencia.

Para abordar esta preocupación, Anthropic ha entrenado un nuevo filtro de seguridad llamado clasificador que monitorea y bloquea técnicas precisas en los informes. La compañía dice que hasta el artículo del 30 de junio, el método ha sido frustrado en más del 99% de los intentos. En cambio, las solicitudes bloqueadas se pasan al Opus 4.8, más débil, que notifica al usuario. La desventaja es que habrá más falsas alarmas durante la codificación y depuración normales.

El Mythos 5 es el mismo modelo básico con menos barandillas de seguridad y lleva una correa más corta. El acceso se reanudó el 26 de junio para aproximadamente 100 empresas y agencias federales estadounidenses que protegen la infraestructura crítica. Anthropic dijo que todavía está trabajando con el gobierno para ampliar el acceso.

El secretario de Comercio, Howard Lutnick, quien aprobó la revocación, dijo que el departamento pasó dos semanas revisando el modelo de Anthropic. En su carta, la empresa acordó investigar de forma independiente los problemas de seguridad, realizar ajustes en versiones futuras e informar cualquier uso malicioso que descubra.

Según se informa, las negociaciones fueron dirigidas por el cofundador Tom Brown y no por el director ejecutivo Dario Amodei, quien ha estado en desacuerdo con la administración durante gran parte de este año.

La batalla fue caótica desde el principio. La investigación de Amazon y las preocupaciones del director ejecutivo Andy Jassy impulsaron el pedido inicial, según múltiples informes, incluido el Wall Street Journal. El ex zar de la IA, David Sachs, acusó a Anthropic de «priorizar la continuación de un modelo de consumo por encima de la seguridad». Algunos interpretan esto como una sobrecorrección.

Francesco Bailo, investigador de gobernanza de IA en la Universidad de Sydney, dijo a Al Jazeera que el gobierno parecía aceptar que la reversión había ido demasiado lejos y que un grupo de líderes de seguridad había firmado una carta abierta pidiendo que se levantaran los controles.

Se trataba de competencia. La suspensión se produce en un momento en que están surgiendo modelos chinos de código abierto más baratos y más capaces, y varios ejecutivos han advertido que congelar los modelos estadounidenses dará a los rivales tiempo libre para ponerse al día.

Anthropic también propone algo que a la industria le faltaba: una forma común de clasificar cuán peligrosos son realmente los jailbreaks. Queremos trabajar con Amazon, Microsoft, Google y otros socios para evaluar sus puntuaciones en cuatro dimensiones:

Empoderamiento: hasta qué punto un jailbreak puede llevar a los usuarios más allá de las herramientas que ya tienen. Ancho: La cantidad de ataques diferentes que se pueden desbloquear con el mismo truco. Facilidad de armamento: cuánta habilidad y esfuerzo se requiere para convertirlo en un ataque real. Descubribilidad: Qué tan fácil es encontrar o copiar un truco.

Para los peores escenarios, como jailbreaks que permiten ataques a redes eléctricas o bancos, Anthropic dice que comenzará a implementar correcciones tan pronto como se determine que son graves, y agrega que ha creado un equipo para monitorear los informes de jailbreaks las 24 horas del día.

También lanzó el programa HackerOne para que los investigadores informen sobre nuevas fugas de Fable 5 y prometió acceso temprano al gobierno de EE. UU. para probar futuros modelos Frontier antes de su lanzamiento.

Anthropic no es el único laboratorio en esta posición. Días antes, OpenAI presentó GPT-5.6 a un pequeño grupo aprobado por el gobierno en lugar de al público, citando preocupaciones similares sobre el doble uso. Un modelo que es lo suficientemente bueno para que los defensores corrijan errores también lo es para que los atacantes encuentren errores.

El riesgo no es hipotético. A principios de esta primavera, Anthropic probó modelos Mythos anteriores que descubrieron y explotaron errores de día cero en todos los principales sistemas operativos y navegadores, incluido un defecto de 27 años en OpenBSD. El equipo rojo convirtió el error recién revelado en un exploit funcional en un día.

La crisis inmediata ha terminado. La pregunta más importante no es. Una orden ejecutiva del 2 de junio creó una vía voluntaria para que las empresas revisen los modelos Frontier antes de que salgan a la venta. También estableció puntos de referencia confidenciales para determinar qué modelos cuentan como «elegibles» y excluyó cualquier licencia obligatoria para enviarlos. Fable 5 nunca siguió ese camino.

En cambio, el gobierno recurrió a controles de exportación. Eso significa que cuando Washington quiere avanzar rápidamente según el modelo fronterizo, todavía no existe un proceso vinculante, sólo un proceso improvisado.

Source link

What's Hot

Las PFAS en la atención sanitaria podrían reducirse si se identifican alternativas

El nuevo resorte láser ofrece una nueva forma de impulsar el plasma

La okupación fantasma utiliza dominios de alucinación de IA para phishing y malware

Anthropic restaura Claude Fable 5 después de que Estados Unidos levantara las restricciones a la exportación relacionadas con el jailbreak

La okupación fantasma utiliza dominios de alucinación de IA para phishing y malware

La aplicación de contraseña de Azure CLI llega al menos a 78 cuentas de Microsoft en más de 81 millones de intentos

Los investigadores analizan 3000 cargas útiles de ClickFix en vivo y exponen la entrega de malware impulsada por API

Las PFAS en la atención sanitaria podrían reducirse si se identifican alternativas

El nuevo resorte láser ofrece una nueva forma de impulsar el plasma

La okupación fantasma utiliza dominios de alucinación de IA para phishing y malware

Anthropic restaura Claude Fable 5 después de que Estados Unidos levantara las restricciones a la exportación relacionadas con el jailbreak

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

What's Hot

Anthropic restaura Claude Fable 5 después de que Estados Unidos levantara las restricciones a la exportación relacionadas con el jailbreak

Related Posts