OpenAI está lanzando una nueva versión de ChatGPT Images que promete un mejor seguimiento de comandos, una edición más precisa y velocidades de generación de imágenes hasta 4 veces más rápidas.
Este nuevo modelo, llamado GPT Image 1.5, estará disponible para todos los usuarios de ChatGPT a través de API a partir del martes. Esta es la última escalada en la competencia de Google con Gemini después de que el CEO de OpenAI, Sam Altman, declarara un «código rojo» en un memorando interno filtrado el mes pasado. El memorando detalla los planes de OpenAI para recuperar su posición como líder en IA después de que Google comenzara a ganar participación de mercado tras el lanzamiento de su último modelo insignia, Gemini 3, y Nano Banana Pro, la última versión del generador de imágenes virales de Google, los cuales encabezaron la clasificación LMArena en múltiples puntos de referencia.
Google sigue a la cabeza después de que OpenAI respondiera a su éxito con el lanzamiento de GPT-5.2 la semana pasada, promocionándolo como su modelo más avanzado hasta el momento para desarrolladores y uso profesional cotidiano. Según se informa, OpenAI planeaba lanzar un nuevo generador de imágenes a principios de enero, y el anuncio de esta semana aceleró esos planes. El último lanzamiento del modelo de imagen fue GPT Image 1 en abril.
GPT Image 1.5 llega a medida que los generadores de imágenes y videos avanzan más allá de los prototipos y obtienen más capacidades listas para la producción. Al igual que Nano Banana Pro, ChatGPT Image ofrece capacidades de posproducción y proporciona controles de edición más detallados para mantener la coherencia visual, como la similitud facial, la iluminación, la composición y el tono durante toda la edición.

Esta es una gran mejora ya que la mayoría de las herramientas de imágenes GenAI no son buenas para iterar. Cuando se le pide que haga un cambio específico, como ajustar las expresiones faciales o atenuar la iluminación, el modelo a menudo reinterpreta la imagen completa, lo que genera una falta de coherencia.
Las actualizaciones no se tratan sólo de nuevas funciones. Ahora también se puede acceder a las imágenes de ChatGPT a través de un punto de entrada dedicado en la barra lateral de ChatGPT, que funciona «más como un estudio creativo», dijo Fidji Simo, director ejecutivo de aplicaciones de OpenAI, en una publicación de blog el martes.
«Las nuevas pantallas de visualización y edición de imágenes facilitan la creación de imágenes que coincidan con su visión y la inspiración con indicaciones de tendencias y filtros preestablecidos», escribió Simo.
evento de crisis tecnológica
san francisco
|
13-15 de octubre de 2026
Además de un nuevo generador de imágenes, OpenAI presenta nuevas formas de mejorar su experiencia ChatGPT con más elementos visuales. Según Simo, el plan es mostrar más imágenes con fuentes claras en las consultas de búsqueda, lo que podría ser útil para tareas como convertir mediciones o verificar resultados deportivos.
«Cuando creas, necesitas poder ver y articular lo que estás creando. Si las imágenes cuentan una historia mejor que las palabras solas, ChatGPT debería incluirlas», escribió Simo. «Si necesita una respuesta de inmediato, o si su próximo paso es utilizar otra herramienta, debería estar allí. De esa manera, podemos seguir acortando la distancia entre lo que tiene en la cabeza y su capacidad para hacerlo realidad».
Source link
