Claude Fable 5 de Anthropic es la versión del mito ahora accesible al público en general

Anthropic está presentando su modelo de IA más poderoso al público en general por primera vez, pero lo hace con barreras de seguridad.

El martes, la empresa de inteligencia artificial anunció Claude Fable 5, la primera versión disponible públicamente del modelo Mythos. Anthropic dice que Fable 5 sobresale en ingeniería de software, trabajo de conocimiento y visión, pero tiene severas limitaciones de seguridad. En áreas de alto riesgo como la ciberseguridad, la biología, la química y la destilación, el modelo bloquea la respuesta y recurre a Claude Opus 4.8.

Lanzado en versión preliminar en abril, Mythos se limitó inicialmente a un pequeño número de socios debido a preocupaciones de ciberseguridad. La semana pasada, Anthropic amplió su acceso a cientos de organizaciones en 15 países, centrándose una vez más en organizaciones que gestionan infraestructura crítica.

Ahora, una versión de esa tecnología está disponible para todos a través de la API Claude de Anthropic y los planes empresariales de pago por uso. El acceso con suscripciones se implementará por etapas. Hasta el 22 de junio, Fable 5 está incluido en los planes Pro, Max, Team y Enterprise basados en asientos sin cargo adicional. El 23 de junio, Anthropic eliminará Fable 5 de estos planes, que ahora requerirán créditos de uso, y lo restaurará como una función de suscripción estándar lo antes posible.

Anthropic está lanzando una nueva versión de Mythos, llamada Mythos 5, para organizaciones que ya han sido aprobadas para acceder a modelos avanzados.

El lanzamiento de Fable se produce mientras Anthropic se prepara para ingresar al mercado público junto con OpenAI y SpaceX de Elon Musk. Esto también sigue a un llamamiento de las empresas de IA que piden a los principales laboratorios de IA del mundo que establezcan un pedal de freno coordinado en el desarrollo de la IA de vanguardia. Anthropik advirtió que los sistemas están avanzando rápidamente y pronto podrían lograr la automejora recursiva (RSI), donde los sistemas se mejoran a sí mismos de forma autónoma sin intervención humana.

Anthropic, temeroso de la posibilidad de que los modelos de clase Mythos caigan en las manos equivocadas, dice que intentó un jailbreak y probó el clasificador antes de lanzar Fable 5.

«Implementamos internamente una recompensa por errores externos, pero más de 1000 horas de pruebas no encontraron un jailbreak universal. Luego trabajamos con una organización externa del equipo rojo y tampoco pudimos encontrar un jailbreak universal».

Sin embargo, es posible que aún existan nuevos ataques. Como resultado, con el lanzamiento de Fable 5 y Mythos 5, Anthropic dijo que ahora requerirá 30 días de retención en todo el tráfico, incluso si las empresas anteriormente tenían un acuerdo de retención cero. La compañía dijo que no utilizará estos datos para entrenamiento, sólo para «defenderse contra ataques complejos y novedosos, incluidos nuevos jailbreak» e «identificar y reducir los falsos positivos». Esta política podría sentar un precedente para una industria donde el acceso a modelos cada vez más potentes viene con políticas obligatorias de retención de datos integradas como salvaguardas.

Para aquellos que se apegan a este modelo, no todas las preguntas tendrán una respuesta en Fable 5. Según Anthropic, hay casos raros en los que Fable debe posponerse hasta Opus 4.8, y los primeros datos muestran que al menos el 95% de las sesiones de Fable se ejecutan completamente con las respuestas del propio modelo.

La firma de análisis Hex dijo en un comunicado que, por primera vez, Fable obtuvo una puntuación del 90% en pruebas de terceros en un punto de referencia de análisis que es fundamental para tareas analíticas complejas y de larga duración.

«Demostramos un gran juicio y atención a los matices cuando se trata de las preguntas más difíciles», dijo Hex.

La plataforma de codificación Vibe Base44 dijo en un comunicado que Fable sobresale en «aplicaciones completas de una sola vez» y tiene excelentes llamadas de herramientas. Según Genspark, plataforma de agentes y espacio de trabajo impulsada por IA, Fable superó a todos los demás modelos en su evaluación y tuvo un desempeño significativamente mejor en tareas como el diseño de la interfaz de usuario y la codificación de juegos.

Tanto Fable 5 como Mythos 5 tienen un precio de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida, el doble del precio de Opus 4.8. Este precio por sí solo puede ser un impedimento para su uso generalizado.

Muchas empresas son cada vez más críticas con los costos de la IA, ya que ven que llegan facturas de IA y que los presupuestos anuales de IA se agotan prematuramente. Los modelos avanzados como Opus 4.8 pueden exacerbar estos problemas porque tienen habilidades de inferencia avanzadas que pueden dividir una única solicitud en múltiples tareas.

Anthropic dijo que espera que la demanda de Fable 5 sea muy alta y difícil de predecir. Y ciertamente algunos, como la plataforma de recompensas por compras Rakuten, pueden pensar que el aumento de precio vale la pena.

«Con el máximo esfuerzo, Fable reflexionará y verificará sus esfuerzos», dijo Rakuten en un comunicado. «Para nosotros, esto es lo que permite operaciones altamente autónomas, y pensar más vale la pena».

Si compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta la independencia editorial.

Source link

What's Hot

Suecia tomará medidas para prohibir las PFAS en productos de consumo a partir de 2028

Geosystems Hellas transforms space data into geospatial intelligence

Una falla crítica en TeamCity podría permitir a un atacante ejecutar comandos del sistema operativo sin iniciar sesión

Claude Fable 5 de Anthropic es la versión del mito ahora accesible al público en general

Microsoft presenta el primer modelo de ciberseguridad y un nuevo sistema de ciberseguridad para agentes

Antares recauda 470 millones de dólares para construir un reactor nuclear para el ejército estadounidense

La violación de Hugging Face de OpenAI reaviva el debate sobre coordinación y control

Suecia tomará medidas para prohibir las PFAS en productos de consumo a partir de 2028

Geosystems Hellas transforms space data into geospatial intelligence

Una falla crítica en TeamCity podría permitir a un atacante ejecutar comandos del sistema operativo sin iniciar sesión

Los investigadores dicen que la IA ayudó a convertir la competencia de control del tráfico de Linux en explotación raíz

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

What's Hot

Claude Fable 5 de Anthropic es la versión del mito ahora accesible al público en general

Related Posts