Un grupo de docenas de expertos en ciberseguridad, incluidos varios veteranos destacados de la industria, ha publicado una carta abierta pidiendo al gobierno de Estados Unidos que levante las órdenes de control de exportaciones de los modelos Fable y Mythos de Anthropic.
Según la carta abierta, «esta acción priva a los defensores (de la ciberseguridad) de sus mejores modelos», que ahora no pueden utilizar para descubrir vulnerabilidades y hacer que el software y los productos sean más seguros.
«Es peligroso extraer lo mejor de los defensores sin una buena razón cuando el enemigo avanza rápidamente», decía la carta.
Según Anthropic, el viernes el gobierno de Estados Unidos ordenó a Anthropic restringir la exportación de fábulas y mitos, citando preocupaciones de seguridad nacional y sin proporcionar una razón específica. En respuesta, la empresa suspendió el acceso al modelo para todos los usuarios en todo el mundo.
Al momento de escribir este artículo, la carta ha sido firmada por 76 profesionales de la ciberseguridad. Casey Ellis, fundador de la plataforma de recompensas por errores Bugcrowd. Jon Callas, reconocido criptólogo y exgerente de arquitectura y diseño de seguridad en Apple. Paul Vixey, informático. Dino Dai Zovi, exjefe de ingeniería de seguridad aplicada de Block. Katie Moussouris, fundadora de Luta Security. y Rachel Toback, directora ejecutiva de la empresa de formación en materia de seguridad SocialProof Security.
Cuando Mythos se lanzó en versión preliminar en abril, Anthropic argumentó que Mythos era tan poderoso para detectar vulnerabilidades de seguridad que el acceso debía restringirse severamente para evitar que piratas informáticos maliciosos y adversarios extranjeros usaran Mythos para causar estragos en Internet. En la práctica, esto significa que Anthropic proporcionó acceso inicial a Mythos a aproximadamente 50 empresas y recientemente amplió ese grupo para incluir aproximadamente 150 organizaciones en 15 países.
Anthropic lanzó Fable, una versión pública de Mythos, la semana pasada, pero la compañía dice que el modelo tenía barreras estrictas para evitar su uso en biología, química y ciberseguridad, y para evitar que otros lo extraigan para recrearlo. Las barreras de seguridad de Fable eran tan estrictas que muchos expertos en ciberseguridad descubrieron que esencialmente detenía todas las indicaciones relacionadas con la ciberseguridad.
Anthropic dijo que la orden de control de exportaciones de la Casa Blanca puede haberse basado en informes de que existe una manera de eludir a Fable y desbloquear sus poderosas capacidades a nivel de Mitos.
consulta
¿Tiene más información sobre el documento de Amazon que provocó la prohibición? Nos encantaría escuchar tu opinión. Puede comunicarse con Lorenzo Franceschi-Bicchierai de forma segura desde cualquier dispositivo o red que no sea del trabajo en Signal (+1 917 257 1382), Telegram y Keybase @lorenzofb o correo electrónico.
Katie Moussoulis, una de las firmantes de la carta abierta, dijo que la técnica fue demostrada en un artículo privado revisado por pares por investigadores de Amazon.
Sin embargo, Moussouris dijo en una publicación de blog que el documento en realidad no demuestra un jailbreak. En cambio, después de que el modelo inicialmente se negó a «revisar el código por problemas de seguridad», los investigadores simplemente le pidieron a Fable que arreglara el código fuente abierto, que contenía vulnerabilidades conocidas disponibles públicamente y «vulnerabilidades implantadas intencionalmente», escribió.
«El comportamiento descrito en el documento no puede modificarse significativamente y cualquier intento sólo debilitará el modelo defensivo», escribió Mousouris. «Los defensores deben poder pedirle a la IA que corrija errores en sus archivos, explicar por qué la corrección es importante y escribir pruebas para confirmar que el parche funciona. Esto no significa eludir las barreras de seguridad. Lo más valioso que puede hacer un modelo de IA para la seguridad del defensor es ejecutar el ciclo de búsqueda, corrección y prueba que los defensores hacen todos los días».
Las críticas de Moussouri se hicieron eco en la carta abierta, que decía que el grupo de expertos creía que las características del modelo en el artículo de Amazon podrían «reproducirse» en GPT-5.5 de OpenAI, Claude Opus 4.8 y Sonnet de Anthropic, e incluso «modelos chinos como Kimi 2.7».
Moussouris dijo a TechCrunch: «Los errores utilizados para demostrar la técnica en el documento se pueden encontrar usando otros modelos. La técnica en el documento es una técnica de derivación de barandillas. Otros modelos sin barandillas en Fable a menudo no rechazan la simple solicitud de buscar errores de seguridad, por lo que no es necesario pasar por alto».
La carta también pedía que se crearan regulaciones a través de un «proceso democrático de elaboración de reglas» basado en investigaciones científicas realizadas por expertos académicos y de la industria, y que se aplicaran de manera transparente y justa «para usarse sólo en la medida mínima necesaria para garantizar la seguridad del pueblo estadounidense».
Si compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta la independencia editorial.
Source link
