Anthropic ha lanzado una nueva versión de su modelo Sonnet de tamaño mediano para coincidir con el ciclo de actualización de cuatro meses de la compañía. En una publicación que anuncia el nuevo modelo, Anthropic destacó mejoras en la forma de codificar, seguir instrucciones y utilizar las computadoras.
Sonnet 4.6 será el modelo predeterminado para los usuarios de los planes Free y Pro.
La versión beta de Sonnet 4.6 incluye una ventana de contexto de 1 millón de tokens, que es el doble del tamaño de la ventana más grande disponible anteriormente en Sonnet. Anthropic describió la nueva ventana de contexto como «suficiente para contener una base de código completa, un contrato largo o docenas de artículos de investigación en una sola solicitud».
Este lanzamiento llega solo dos semanas después del lanzamiento de Opus 4.6, y es probable que en las próximas semanas sigan modelos Haiku actualizados.
El anuncio viene acompañado de una serie de nuevos puntajes récord de referencia, incluidos OS World para Computación y SWE-Bench para Ingeniería de Software. Pero quizás lo más impresionante sea su puntuación del 60,4% en el ARC-AGI-2, cuyo objetivo es medir habilidades específicas de la inteligencia humana. En este sentido, el Sonnet 4.6 supera a la mayoría de los modelos comparables, pero aún está por detrás de modelos como el Opus 4.6, el Gemini 3 Deep Think y una versión sofisticada de GPT 5.2.
Source link
