OpenAI continúa su camino de guerra ‘Code Red’ con un nuevo modelo de generación de imágenes

OpenAI está lanzando una nueva versión de ChatGPT Images que promete un mejor seguimiento de comandos, una edición más precisa y velocidades de generación de imágenes hasta 4 veces más rápidas.

Este nuevo modelo, llamado GPT Image 1.5, estará disponible para todos los usuarios de ChatGPT a través de API a partir del martes. Esta es la última escalada en la competencia de Google con Gemini después de que el CEO de OpenAI, Sam Altman, declarara un «código rojo» en un memorando interno filtrado el mes pasado. El memorando detalla los planes de OpenAI para recuperar su posición como líder en IA después de que Google comenzara a ganar participación de mercado tras el lanzamiento de su último modelo insignia, Gemini 3, y Nano Banana Pro, la última versión del generador de imágenes virales de Google, los cuales encabezaron la clasificación LMArena en múltiples puntos de referencia.

Google sigue a la cabeza después de que OpenAI respondiera a su éxito con el lanzamiento de GPT-5.2 la semana pasada, promocionándolo como su modelo más avanzado hasta el momento para desarrolladores y uso profesional cotidiano. Según se informa, OpenAI planeaba lanzar un nuevo generador de imágenes a principios de enero, y el anuncio de esta semana aceleró esos planes. El último lanzamiento del modelo de imagen fue GPT Image 1 en abril.

GPT Image 1.5 llega a medida que los generadores de imágenes y videos avanzan más allá de los prototipos y obtienen más capacidades listas para la producción. Al igual que Nano Banana Pro, ChatGPT Image ofrece capacidades de posproducción y proporciona controles de edición más detallados para mantener la coherencia visual, como la similitud facial, la iluminación, la composición y el tono durante toda la edición.

La misma imagen que se muestra arriba, con diferentes ediciones para mostrar el seguimiento de comandos mejorado de GPT Image 1.5.Crédito de la imagen: OpenAI

Esta es una gran mejora ya que la mayoría de las herramientas de imágenes GenAI no son buenas para iterar. Cuando se le pide que haga un cambio específico, como ajustar las expresiones faciales o atenuar la iluminación, el modelo a menudo reinterpreta la imagen completa, lo que genera una falta de coherencia.

Las actualizaciones no se tratan sólo de nuevas funciones. Ahora también se puede acceder a las imágenes de ChatGPT a través de un punto de entrada dedicado en la barra lateral de ChatGPT, que funciona «más como un estudio creativo», dijo Fidji Simo, director ejecutivo de aplicaciones de OpenAI, en una publicación de blog el martes.

«Las nuevas pantallas de visualización y edición de imágenes facilitan la creación de imágenes que coincidan con su visión y la inspiración con indicaciones de tendencias y filtros preestablecidos», escribió Simo.

evento de crisis tecnológica

san francisco
|
13-15 de octubre de 2026

Además de un nuevo generador de imágenes, OpenAI presenta nuevas formas de mejorar su experiencia ChatGPT con más elementos visuales. Según Simo, el plan es mostrar más imágenes con fuentes claras en las consultas de búsqueda, lo que podría ser útil para tareas como convertir mediciones o verificar resultados deportivos.

«Cuando creas, necesitas poder ver y articular lo que estás creando. Si las imágenes cuentan una historia mejor que las palabras solas, ChatGPT debería incluirlas», escribió Simo. «Si necesita una respuesta de inmediato, o si su próximo paso es utilizar otra herramienta, debería estar allí. De esa manera, podemos seguir acortando la distancia entre lo que tiene en la cabeza y su capacidad para hacerlo realidad».

Source link

What's Hot

OpenAI presenta una vista previa de GPT-5.6 Sol con restricciones de acceso y medidas de seguridad cibernética más estrictas

Corgi, la popular startup de tecnología de seguros respaldada por Y Combinator, afirma que no está robando productos de código abierto

El FBI advierte que los piratas informáticos de inteligencia rusos apuntan a las claves de recuperación de respaldo de señal

OpenAI continúa su camino de guerra ‘Code Red’ con un nuevo modelo de generación de imágenes

Corgi, la popular startup de tecnología de seguros respaldada por Y Combinator, afirma que no está robando productos de código abierto

Novak Djokovic tiene un nuevo trabajo: asesor de la firma de capital privado General Atlantic

OpenAI restringe la implementación de GPT-5.6 a pedido del gobierno, dice que las restricciones no deberían ser estándar

OpenAI presenta una vista previa de GPT-5.6 Sol con restricciones de acceso y medidas de seguridad cibernética más estrictas

Corgi, la popular startup de tecnología de seguros respaldada por Y Combinator, afirma que no está robando productos de código abierto

El FBI advierte que los piratas informáticos de inteligencia rusos apuntan a las claves de recuperación de respaldo de señal

Novak Djokovic tiene un nuevo trabajo: asesor de la firma de capital privado General Atlantic

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

What's Hot

OpenAI continúa su camino de guerra ‘Code Red’ con un nuevo modelo de generación de imágenes

Related Posts