El lunes, Anthropic anunció la última versión de su modelo insignia, Opus 4.5. Este es el último modelo de la serie Anthropic 4.5 que se lanzará, luego del lanzamiento de Sonnet 4.5 en septiembre y Haiku 4.5 en octubre.
Como se esperaba, la nueva versión de Opus ofrece un rendimiento de última generación en una variedad de puntos de referencia, incluidos puntos de referencia de codificación (banco SWE y banco de terminales), uso de herramientas (banco tau2 y MCP Atlas) y resolución de problemas generales (ARC-AGI 2, GPQA Diamond).
En particular, Opus 4.5 es el primer modelo que obtiene una puntuación superior al 80% en la validación SWE-Bench, un popular punto de referencia de codificación.
Anthropic también lanzó una serie de productos paralelos para resaltar el uso de computadoras y las capacidades de hojas de cálculo de Opus y demostrar cómo funciona el modelo en estas configuraciones. Junto con Opus 4.5, Anthropic está haciendo que sus productos piloto Claude para Chrome y Claude para Excel estén más ampliamente disponibles. La extensión de Chrome está disponible para todos los usuarios de Max y el modelo centrado en Excel está disponible para los usuarios de Max, Team y Enterprise.
Opus 4.5 también incluye mejoras de memoria para operaciones de contexto prolongado, que requirieron cambios significativos en la forma en que los modelos administran la memoria.
«El entrenamiento con Opus 4.5 ha mejorado la calidad de los contextos largos comunes, pero las ventanas de contexto por sí solas no son suficientes», dijo a TechCrunch Dianne Na Penn, jefa de gestión de productos de investigación de Anthropic. «Conocer los detalles correctos para recordar es muy importante como complemento a simplemente tener una ventana de contexto más larga».
Estos cambios también habilitan una función de «chat sin fin» solicitada desde hace mucho tiempo para los usuarios pagos de Claude, lo que permite que el chat continúe sin interrupciones cuando un modelo llega a la ventana contextual. En cambio, el modelo compacta la memoria contextual sin advertir al usuario.
evento de crisis tecnológica
san francisco
|
13-15 de octubre de 2026
Muchas de las actualizaciones se han realizado teniendo en cuenta los casos de uso de agentes, específicamente escenarios en los que Opus actúa como agente principal que dirige un grupo de subagentes impulsados por Haiku. Gestionar estas tareas requiere comandos sólidos de la memoria de trabajo, y aquí es donde las mejoras de la memoria que describe Penn tienen un valor real.
«Los fundamentos como la memoria son realmente importantes aquí porque Claude necesita poder explorar bases de código y documentos grandes, y necesita saber cuándo regresar y mirar algo nuevamente», dice Penn.
Opus 4.5 enfrentará una dura competencia de otros modelos Frontier lanzados recientemente, particularmente GPT 5.1 de OpenAI (lanzado el 12 de noviembre) y Gemini 3 de Google (lanzado el 18 de noviembre).
Source link
