Anthropic está presentando su modelo de IA más poderoso al público en general por primera vez, pero lo hace con barreras de seguridad.
El martes, la empresa de inteligencia artificial anunció Claude Fable 5, la primera versión disponible públicamente del modelo Mythos. Anthropic dice que Fable 5 sobresale en ingeniería de software, trabajo de conocimiento y visión, pero tiene severas limitaciones de seguridad. En áreas de alto riesgo como la ciberseguridad, la biología, la química y la destilación, el modelo bloquea la respuesta y recurre a Claude Opus 4.8.
Lanzado en versión preliminar en abril, Mythos se limitó inicialmente a un pequeño número de socios debido a preocupaciones de ciberseguridad. La semana pasada, Anthropic amplió su acceso a cientos de organizaciones en 15 países, centrándose una vez más en organizaciones que gestionan infraestructura crítica.
Ahora, una versión de esa tecnología está disponible para todos a través de la API Claude de Anthropic y los planes empresariales de pago por uso. El acceso con suscripciones se implementará por etapas. Hasta el 22 de junio, Fable 5 está incluido en los planes Pro, Max, Team y Enterprise basados en asientos sin cargo adicional. El 23 de junio, Anthropic eliminará Fable 5 de estos planes, que ahora requerirán créditos de uso, y lo restaurará como una función de suscripción estándar lo antes posible.
Anthropic está lanzando una nueva versión de Mythos, llamada Mythos 5, para organizaciones que ya han sido aprobadas para acceder a modelos avanzados.
El lanzamiento de Fable se produce mientras Anthropic se prepara para ingresar al mercado público junto con OpenAI y SpaceX de Elon Musk. Esto también sigue a un llamamiento de las empresas de IA que piden a los principales laboratorios de IA del mundo que establezcan un pedal de freno coordinado en el desarrollo de la IA de vanguardia. Anthropik advirtió que los sistemas están avanzando rápidamente y pronto podrían lograr la automejora recursiva (RSI), donde los sistemas se mejoran a sí mismos de forma autónoma sin intervención humana.
Anthropic, temeroso de la posibilidad de que los modelos de clase Mythos caigan en las manos equivocadas, dice que intentó un jailbreak y probó el clasificador antes de lanzar Fable 5.
«Implementamos internamente una recompensa por errores externos, pero más de 1000 horas de pruebas no encontraron un jailbreak universal. Luego trabajamos con una organización externa del equipo rojo y tampoco pudimos encontrar un jailbreak universal».
Sin embargo, es posible que aún existan nuevos ataques. Como resultado, con el lanzamiento de Fable 5 y Mythos 5, Anthropic dijo que ahora requerirá 30 días de retención en todo el tráfico, incluso si las empresas anteriormente tenían un acuerdo de retención cero. La compañía dijo que no utilizará estos datos para entrenamiento, sólo para «defenderse contra ataques complejos y novedosos, incluidos nuevos jailbreak» e «identificar y reducir los falsos positivos». Esta política podría sentar un precedente para una industria donde el acceso a modelos cada vez más potentes viene con políticas obligatorias de retención de datos integradas como salvaguardas.
Para aquellos que se apegan a este modelo, no todas las preguntas tendrán una respuesta en Fable 5. Según Anthropic, hay casos raros en los que Fable debe posponerse hasta Opus 4.8, y los primeros datos muestran que al menos el 95% de las sesiones de Fable se ejecutan completamente con las respuestas del propio modelo.
La firma de análisis Hex dijo en un comunicado que, por primera vez, Fable obtuvo una puntuación del 90% en pruebas de terceros en un punto de referencia de análisis que es fundamental para tareas analíticas complejas y de larga duración.
«Demostramos un gran juicio y atención a los matices cuando se trata de las preguntas más difíciles», dijo Hex.
La plataforma de codificación Vibe Base44 dijo en un comunicado que Fable sobresale en «aplicaciones completas de una sola vez» y tiene excelentes llamadas de herramientas. Según Genspark, plataforma de agentes y espacio de trabajo impulsada por IA, Fable superó a todos los demás modelos en su evaluación y tuvo un desempeño significativamente mejor en tareas como el diseño de la interfaz de usuario y la codificación de juegos.
Tanto Fable 5 como Mythos 5 tienen un precio de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, el doble del precio de Opus 4.8. Este precio por sí solo puede ser un impedimento para su uso generalizado.
Muchas empresas son cada vez más críticas con los costos de la IA, ya que ven que llegan facturas de IA y que los presupuestos anuales de IA se agotan prematuramente. Los modelos avanzados como Opus 4.8 pueden exacerbar estos problemas porque tienen habilidades de inferencia avanzadas que pueden dividir una única solicitud en múltiples tareas.
Anthropic dijo que espera que la demanda de Fable 5 sea muy alta y difícil de predecir. Y ciertamente algunos, como la plataforma de recompensas por compras Rakuten, pueden pensar que el aumento de precio vale la pena.
«Con el máximo esfuerzo, Fable reflexionará y verificará sus esfuerzos», dijo Rakuten en un comunicado. «Para nosotros, esto es lo que permite operaciones altamente autónomas, y pensar más vale la pena».
Si compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta la independencia editorial.
Source link
