OpenAI lanzó su último modelo Frontier, GPT-5.2, el jueves a medida que se intensifica la competencia de Google, promocionándolo como su modelo más avanzado hasta el momento y diseñado para desarrolladores y profesionales cotidianos.
GPT-5.2 de OpenAI está disponible a través de API para usuarios y desarrolladores pagos de ChatGPT en tres versiones: Instant es un modelo de velocidad optimizada para consultas cotidianas como búsqueda, escritura y traducción de información. Capacidad de pensamiento. Destaca en tareas estructuradas complejas como codificación, análisis de documentos largos, matemáticas y planificación. Pro es un modelo de primera línea diseñado para brindar máxima precisión y confiabilidad para problemas difíciles.
«Diseñamos 5.2 para desbloquear aún más valor económico para las personas», dijo Fiji Simo, director de producto de OpenAI, en una conferencia de prensa con periodistas el jueves. «Soy bueno creando hojas de cálculo, creando presentaciones, escribiendo código, reconociendo imágenes, comprendiendo contextos extensos, usando herramientas y vinculando proyectos complejos de varios pasos».
GPT-5.2 está en una carrera armamentista con Gemini 3 de Google. Gemini 3 encabeza la clasificación de LMArena en la mayoría de los puntos de referencia (aparte de la codificación, Claude Opus-4.5 de Anthropic sigue oscilando).
A principios de este mes, The Information informó que el CEO Sam Altman publicó un memorando interno «Código Rojo» para el personal en medio de preocupaciones sobre la disminución del tráfico de ChatGPT y la pérdida de participación en el mercado de consumidores frente a Google. Code Red requirió un cambio en las prioridades, incluido detener esfuerzos como introducir anuncios y centrarse en crear una mejor experiencia ChatGPT.
GPT-5.2 es un esfuerzo de OpenAI para recuperar el control y, según se informa, algunos empleados solicitaron que se retrase el lanzamiento del modelo para darle a la empresa más tiempo para realizar mejoras. Y a pesar de los indicios de que OpenAI se centrará en los casos de uso del consumidor agregando más personalización a ChatGPT, el lanzamiento de GPT-5.2 busca fortalecer las oportunidades en la empresa.
La compañía se dirige específicamente a los desarrolladores y al ecosistema de herramientas, con el objetivo de convertirse en la base predeterminada para crear aplicaciones impulsadas por IA. A principios de esta semana, OpenAI publicó nuevos datos que muestran que el uso empresarial de sus herramientas de IA ha aumentado dramáticamente durante el año pasado.
evento de crisis tecnológica
san francisco
|
13-15 de octubre de 2026
Esto se produce cuando Gemini 3 está estrechamente integrado en el ecosistema de productos y nube de Google para flujos de trabajo multimodales y de agentes. Google lanzó esta semana un servidor MCP administrado que facilita a los agentes conectar sus servicios de Google con servicios en la nube como Maps y BigQuery. (MCP es un conector entre los sistemas de inteligencia artificial, los datos y las herramientas).
Según OpenAI, GPT-5.2 establece nuevos puntajes de referencia en codificación, matemáticas, ciencia, visión, razonamiento de contexto largo y uso de herramientas, que según la compañía pueden conducir a «flujos de trabajo de agentes más confiables, código de grado de producción y sistemas complejos que operan en contextos a gran escala y datos del mundo real».
Estas características compiten directamente con el modo Deep Think de Gemini 3, que se promociona como un avance importante en el razonamiento matemático, lógico y científico. En los gráficos de referencia de OpenAI, GPT-5.2 Thinking supera a Gemini 3 y Claude Opus 4.5 de Anthropic en casi todas las pruebas de razonamiento enumeradas, desde tareas de ingeniería de software del mundo real (SWE-Bench Pro) y conocimiento científico de nivel de doctorado (GPQA Diamond) hasta razonamiento abstracto y descubrimiento de patrones (ARC-AGI suite).
El investigador principal, Aidan Clarke, dijo que mejorar el rendimiento en matemáticas no se trataba sólo de resolver ecuaciones. Explicó que el razonamiento matemático es una forma de determinar si un modelo puede seguir una lógica de varios pasos, mantener la coherencia numérica en el tiempo y evitar errores sutiles que pueden empeorar con el tiempo.
«Todas estas son características realmente importantes en una variedad de cargas de trabajo», dijo Clark. “Modelados financieros, previsiones, análisis de datos, etc.”
El líder del producto OpenAI, Max Schwarzer, dijo en una sesión informativa que GPT-5.2 «trae mejoras significativas a la generación y depuración de código», lo que permite ejecutar matemáticas y lógica complejas paso a paso. Las nuevas empresas de codificación como Windsurf y CharlieCode están reportando un «rendimiento de codificación de agentes de última generación» y beneficios mensurables en flujos de trabajo complejos de varios pasos, agregó.
Más allá de la codificación, Schwarzer dijo que las respuestas de pensamiento GPT-5.2 tienen un 38% menos de errores que sus predecesores, lo que hace que el modelo sea más confiable en la toma de decisiones, la investigación y la escritura cotidianas.
GPT-5.2 parece menos una reinvención y más una fusión de las dos actualizaciones anteriores de OpenAI. GPT-5, lanzado en agosto, fue un reinicio que sentó las bases para un sistema integrado con enrutadores que cambian de modelo entre un modelo predeterminado rápido y un modo de «pensamiento» más profundo. GPT-5.1 en noviembre se centró en hacer que el sistema fuera más cálido, más conversacional y más adecuado para tareas de codificación y agentes. El último modelo, GPT-5.2, mejora aún más todos estos avances y parece ser una base confiable para el uso en producción.
Para OpenAI, lo que está en juego nunca ha sido tan grande. La compañía se ha comprometido a invertir 1,4 billones de dólares en la construcción de infraestructura de inteligencia artificial durante los próximos años para respaldar el crecimiento. Esta es una promesa hecha cuando todavía existía la ventaja de ser los primeros en actuar entre las empresas de IA. Pero Google, que inicialmente se quedó atrás, ahora está avanzando, y esa apuesta puede estar impulsando el «Código Rojo» de Altman.
El nuevo enfoque de OpenAI en los modelos de inferencia también es un cambio arriesgado. Los sistemas detrás de los modos Thinking e Deep Research realizan más cálculos y, por lo tanto, son más costosos de ejecutar que un chatbot estándar. Al duplicar ese tipo de modelo con GPT-5.2, OpenAI puede estar creando un círculo vicioso. Eso significa gastar más en computación para llegar a las tablas de clasificación y luego gastar aún más para mantener estos costosos modelos funcionando a escala.
Según se informa, OpenAI ya está gastando más en informática que antes. Como informó recientemente TechCrunch, la mayor parte del gasto en inferencia de OpenAI (dinero gastado en computación para ejecutar modelos de IA entrenados) se paga en efectivo en lugar de créditos en la nube, lo que sugiere que los costos de computación de la compañía están creciendo más allá de lo que se puede subsidiar con asociaciones o créditos.
Durante la conferencia telefónica, Simo sugirió que a medida que OpenAI crezca, podría ofrecer más productos y servicios y aumentar los ingresos para pagar computación adicional.
«Pero creo que es importante ubicarlo dentro del arco más amplio de eficiencia», dijo Simo. “Hoy en día se puede obtener más inteligencia con la misma cantidad de computación y la misma cantidad de dinero que hace un año”.
A pesar del enfoque en la inferencia, algo que falta en el anuncio de hoy es un nuevo generador de imágenes. Altman supuestamente dijo en el memorando de Code Red que la generación de imágenes será una prioridad clave en el futuro, especialmente después de que Nano Banana de Google (el apodo del modelo Gemini 2.5 Flash Image de Google) apareciera en los titulares después de su lanzamiento en agosto.
El mes pasado, Google lanzó Nano Banana Pro (también conocido como Gemini 3 Pro Image). Esta es una versión mejorada con una representación de texto aún mejor, conocimiento del mundo y una sensación espeluznante, realista y sin editar en las fotos. También se está integrando más en todos los productos de Google, como lo demostró la semana pasada al aparecer en herramientas y flujos de trabajo como Google Labs Mixboard para la generación automatizada de presentaciones.
Según se informa, OpenAI planea lanzar otro modelo nuevo en enero con mejores imágenes, mayor velocidad y mejor personalidad, pero la compañía no confirmó estos planes el jueves.
OpenAI también anunció el jueves que implementaría nuevas medidas de seguridad en torno al uso de la salud mental y la verificación de la edad para los adolescentes, pero no dedicó gran parte de su tiempo de lanzamiento a promover esos cambios.
Este artículo se ha actualizado con más información sobre el estado de eficiencia informática de OpenAI.
¿Tiene información o documentos confidenciales? Informamos sobre el funcionamiento interno de la industria de la IA, desde las empresas que dan forma al futuro hasta las personas afectadas por sus decisiones. Póngase en contacto con Rebecca Bellan (rebecca.bellan@techcrunch.com) o Russell Brandom (russell.brandom@techcrunch.com). Para comunicarse de forma segura, puede contactarnos a través de Signal en @rebeccabellan.491 y russellbradom.49.
Source link
