El jueves, Anthropic lanzó Opus 4.8, la última versión de su modelo de publicación más avanzado. Este modelo está disponible en todas partes al mismo precio estándar que los lanzamientos anteriores de Opus.
El nuevo modelo fue lanzado sólo 41 días después del lanzamiento de Opus 4.7, un ciclo de actualización mucho más rápido que el habitual de Anthropic. (Los últimos modelos Sonnet y Haiku tienen tres y siete meses, respectivamente). Esta rápida respuesta puede tener algo que ver con la tibia respuesta al Opus 4.7, que algunos usuarios encontraron decepcionante.
Durante este tiempo, también ha habido nuevos lanzamientos importantes de los modelos Codex de OpenAI y Gemini Flash de Google, lo que aumenta la presión sobre Anthropic.
Opus 4.8 incluye los mejores resultados esperados de su clase, pero también se ha prestado especial atención a cómo el modelo gestiona datos incorrectos o inciertos. En un artículo publicado, los primeros evaluadores de Anthropic descubrieron que era más probable que el nuevo modelo señalara incertidumbres operativas y menos probabilidades de hacer afirmaciones sin fundamento.
Como reflejo de esto, los testimonios de los empleados de Bridgewater dicen que la mayor diferencia en la actualización es que «Opus 4.8 tiende a señalar agresivamente problemas con entradas y salidas de análisis que otros modelos rutinariamente omiten y dejan para que el usuario los resuelva».
Junto con el nuevo modelo, Anthropic lanzó una función llamada Dynamic Workflow. Esto estará disponible en Research Preview. El sistema está diseñado para permitir que modelos grandes como Opus gestionen tareas complejas entre cientos de subagentes paralelos.
«Claude Code y Opus 4.8 ahora pueden realizar migraciones a escala de código base a través de cientos de miles de líneas de código, desde el inicio hasta la fusión, utilizando conjuntos de pruebas existentes como barra», explica la publicación.
Anthropic todavía está poniendo en suspenso su modelo Mythos de vanguardia después de que una vista previa preliminar el mes pasado planteara preocupaciones sobre la ciberseguridad. Sin embargo, la compañía insinuó en el lanzamiento de Opus de hoy que el período de vista previa de Mythos podría finalizar pronto una vez que se completen las medidas de seguridad necesarias.
«Estamos avanzando rápidamente para desarrollar estas medidas de seguridad y esperamos tener modelos de clase Mythos disponibles para todos los clientes en las próximas semanas», escribió la compañía.
Si compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta la independencia editorial.
Source link
