Operai anunció una nueva actualización de API el día del desarrollo del lunes, presentando el GPT-5 Pro, el último modelo de idioma, el nuevo modelo de generación de videos, el SORA 2 y un modelo de voz más pequeño y más barato.
La actualización fue parte de una serie de anuncios destinados a declarar a los desarrolladores al ecosistema de OpenAI, incluido el lanzamiento de herramientas de construcción de agentes y la capacidad de construir aplicaciones con CHATGPT.
La adición del GPT-5 Pro podría apelar a los desarrolladores que construyen aplicaciones en finanzas, legal y atención médica, según el CEO de OpenAI, Sam Altman.
Altman también dijo que las capacidades de voz serán esenciales en el futuro. Esta se convertirá en una de las principales formas en que las personas usan para interactuar con la IA. Por esta razón, OpenAI está lanzando el GPT-Realtime Mini, un modelo de voz más pequeño y más barato con una API que admite interacciones de transmisión de baja latencia de audio y audio. El nuevo modelo es 70% más barato que el modelo de voz avanzado anterior de OpenAI, pero promete «la misma calidad de voz y expresividad».
Finalmente, los creadores involucrados en el ecosistema de desarrolladores de OpenAI ahora pueden aprovechar Sora 2 en las avances de la API. Operai lanzó su último generador de audio y video, Sora 2, junto con la competidora de Tiktok, Sora App, que estaba llena de breves videos generados por IA la semana pasada. La aplicación SORA permite a los usuarios generar videos basados en sí mismos, amigos o indicaciones y compartirlos a través de alimentos algoritmos de estilo Tiktok.
«[Los desarrolladores]ahora tienen acceso al mismo modelo que mejora la impresionante salida de video del SORA 2 con su aplicación», dice Altman.
Sora 2 está construida en la generación anterior con escenas más realistas y físicamente consistentes con sonidos sincronizados y mayores controles creativos, desde orientación detallada de la cámara hasta imágenes estilizadas.
Eventos de TechCrunch
San Francisco
|
27-29 de octubre de 2025
«Puede usar vistas de iPhone, por ejemplo, para alentar a Sora a expandirse a amplias tomas de las películas de Speauring», dice Altman. «Pero una de las cosas más emocionantes en las que hemos estado trabajando es en qué tan bien este nuevo modelo trata no solo del discurso, sino también en ricos paisajes sonoros, audio ambiental y las imágenes con efectos de sincronización que se basan en lo que está buscando».
Sora 2 está siendo presentado como una herramienta de desarrollo conceptual, ya sea un punto de partida visual para la publicidad basada en la atmósfera general del producto o un punto de partida visual para que los diseñadores de Mattel conviertan bocetos en conceptos de juguetes.
Source link
