
OpenAI lanzó el viernes tres versiones de GPT-5.6, llamadas Sol, Terra y Luna, en una vista previa limitada para un pequeño número de empresas como parte de su compromiso continuo con el gobierno de EE. UU.
Sol es nuestro modelo insignia más nuevo y el más potente, mientras que Terra ofrece un buen equilibrio entre eficiencia y potencia, y Luna está optimizado para ofrecer velocidad y asequibilidad.
«GPT-5.6 Sol se lanza con la pila de seguridad más sólida hasta la fecha. Hemos reforzado las protecciones contra actividades de alto riesgo, solicitudes cibernéticas sensibles y exploits repetitivos, y pasamos semanas buscando debilidades, probando el sistema y reforzándolo contra ataques del mundo real», dijo OpenAI.
Este modelo ha sido promocionado como el «modelo más capaz hasta ahora» en ciberseguridad y es más adecuado para la investigación y explotación de vulnerabilidades. En ExploitBench, OpenAI señala que GPT‑5.6 Sol compite con Anthropic Mythos Preview utilizando solo aproximadamente un tercio de los tokens de salida.
Añadió que el objetivo es permitir el acceso a trabajos legítimos, como revisiones de código, investigación de vulnerabilidades, desarrollo de parches, depuración, educación sobre seguridad y pruebas defensivas, al mismo tiempo que se aplican barreras de seguridad sólidas para bloquear la actividad ofensiva y remediar rápidamente los jailbreaks recién descubiertos. Esto incluye intentos de los adversarios de hacer jailbreak al modelo y negar lo que llama «asistencia cibernética prohibida».
«A medida que estas capacidades continúan evolucionando, nuestra prioridad es asegurarnos de que lleguen y beneficien a los defensores que pueden usar estas herramientas para encontrar debilidades, desarrollar parches y reforzar sus sistemas de manera más amplia», explicó la compañía de inteligencia artificial (IA).
Dicho esto, OpenAI también advierte que en la versión preliminar, debido a la naturaleza de «doble uso» de la tecnología, puede haber escenarios en los que los usuarios encuentren salvaguardas que bloqueen o rechacen solicitudes legítimas, o donde las solicitudes se suspendan para una revisión adicional.
Según la tarjeta de sistema de vista previa GPT-5.6 de OpenAI, este modelo es bueno para encontrar vulnerabilidades en el código y desarrollar exploits, pero sus capacidades no se extienden a ejecutar ataques autónomos de extremo a extremo contra objetivos reforzados ni a convertir esas vulnerabilidades cibernéticas en armas en ataques reales.

«Una evaluación separada investigó el comportamiento inconsistente en las tareas de codificación agente y encontró que, aunque la tasa absoluta sigue siendo baja, es más probable que GPT-5.6 que GPT-5.5 supere las intenciones del usuario, como realizar o intentar acciones que el usuario no solicitó».
VulnLMP es el marco interno de OpenAI diseñado para probar el desarrollo de cadenas de exploits de extremo a extremo frente a objetivos del mundo real. Evaluamos GPT-5.6 Sol frente a un proyecto de software reforzado ampliamente implementado que utiliza VulnLMP y descubrimos que es un modelo que genera pistas confiables de seguridad de memoria. Algunos de ellos pueden conducir a la divulgación, mutación o ruptura del flujo de control.
«Esto sugiere que una parte importante de la investigación de vulnerabilidades del mundo real es cada vez más automatizable a medida que los modelos se combinan con el uso de herramientas, construcción de sistemas e infraestructura de validación», dijo la startup tecnológica.
OpenAI planea hacer que GPT‑5.6 Sol, Terra y Luna estén disponibles públicamente en las próximas semanas y ha presentado una vista previa de las capacidades del modelo al gobierno de EE. UU. También estamos lanzando una vista previa limitada para un pequeño grupo de socios confiables aprobados por el gobierno para participar antes de un lanzamiento más amplio.
A principios de este mes, el presidente de Estados Unidos, Donald Trump, firmó una orden ejecutiva sobre IA y ciberseguridad, pidiendo la creación de un marco que le daría al gobierno federal la autoridad para evaluar las capacidades de los modelos de IA y determinar cuáles caen bajo el Modelo de Frontera Cubierta, una designación para sistemas de IA con capacidades cibernéticas avanzadas.
Este lanzamiento gradual se produce días después de que la compañía lanzara una versión mejorada de su modelo GPT‑5.5‑Cyber para defensores confiables como parte de su iniciativa Daybreak y lanzara un nuevo proyecto llamado Patch the Planet en colaboración con Trail of Bits para ayudar a proteger proyectos de código abierto.
También sigue a la decisión del gobierno de EE. UU. de permitir que Anthropic lance su modelo Mythos AI a aproximadamente 100 empresas confiables y agencias federales que «operan y defienden infraestructura crítica», más de dos semanas después de que el poderoso modelo centrado en la ciberseguridad fuera retirado del mercado.
«Estamos restaurando rápidamente el acceso a estas organizaciones y continuamos trabajando con los gobiernos para ampliar el acceso a Mythos 5 y hacer que Fable 5 vuelva a estar disponible públicamente», dijo Anthropic en un comunicado publicado en X.
Source link
