El lunes, Humanity lanzó un nuevo modelo Frontier llamado Claude Sonnet 4.5. Afirma proporcionar un rendimiento de vanguardia en los puntos de referencia de código. La compañía dice que Claude Sonnet 4.5 no solo representa un salto en la confiabilidad de los modelos de IA anteriores, sino que también le permite crear aplicaciones «listas para la producción» en lugar de solo un prototipo.
Claude Sonnet 4.5 está disponible con Claude API y Claude Chatbot. Los precios de los desarrolladores son los mismos que Claude Sonnet 4: $ 3 por millón (aproximadamente 750,000 palabras, o toda la serie «Lord of the Rings») y $ 15 por token de producción de $ 100.
El año pasado, los modelos de IA humanos surgieron como un favorito entre los desarrolladores y las empresas debido al fuerte rendimiento de las tareas de ingeniería de software. Según los informes, Apple y Meta usan el modelo Claude AI internamente, y Anthrope está en el negocio clave de vender acceso de API a aplicaciones de codificación de IA como cursor, windsurf y replica. Recientemente, el GPT-5 de Openai ha desafiado la dominación de la humanidad en el espacio, superando el modelo Claude con varios puntos de referencia de codificación.
La humanidad dice que Claude Sonnet 4.5 ofrece un rendimiento líder en la industria en varios puntos de referencia de codificación, incluida la validación de banca SWE. Sin embargo, el investigador de IA humano, David Hershey, le dice a TechCrunch que capturar el rendimiento del soneto de Claude 4.5 solo con puntos de referencia es difícil.

Hershey dice que vio el código Claude Sonnet 4.5 de forma autónoma durante hasta 30 horas durante las primeras pruebas con clientes de algunas compañías. Mientras tanto, vio que el modelo AI no solo construye aplicaciones, sino también de pie de servicio de bases de datos, comprar nombres de dominio y ejecutar auditorías SOC 2 para garantizar que el producto sea seguro.
En una declaración compartida con TechCrunch, el CEO de Cursor, Michael Truell, dijo que Claude Sonnet 4.5 representa un rendimiento de codificación de vanguardia, especialmente para tareas largas en tareas de horizonte. El CEO de Windsurf, Jeff Wang, dijo en un comunicado que Claude Sonnet 4.5 representa un «modelo de codificación de nueva generación».
La humanidad también afirma que Claude Sonnet 4.5 es el modelo de IA fronterizo más consistente hasta la fecha, con una tasa más baja de psicofancia y engaño que los modelos anteriores. La compañía dice que la sensibilidad de Claude a los ataques de inyección rápida también ha mejorado.
Eventos de TechCrunch
San Francisco
|
27-29 de octubre de 2025
Además de la liberación de Claude Sonnet 4.5, Anthrope también libera el Claude Agent SDK. La compañía dice que esto es lo mismo que la infraestructura que mejora el código Claude, y puede usarse para permitir a los desarrolladores construir sus propios agentes.
La humanidad está lanzando una vista previa de investigación temporal llamada «Imagine with Claude», un suscriptor máximo que muestra un software de generación de modelos de IA sobre la marcha. La compañía dice que el modelo responde a las solicitudes de los usuarios en tiempo real sin características predeterminadas o código preescrito.
La competencia tensional en el mundo de la IA ha hecho común que las empresas envíen modelos emblemáticos cada pocos meses. El Claude Sonnet 4.5 se lanzará dentro de los dos meses del último modelo AI de Anthrope, el Claude Opus 4.1. Estos rápidos ciclos de producción dificultan que cualquier empresa tenga clientes potenciales significativos durante mucho tiempo.
Source link
