Operai lanza dos modelos de inferencia de IA «abiertos»

Operai anunció el martes el lanzamiento de dos modelos de inferencia de IA de peso abierto con características similares a la serie O. Ambos son libres de descargar plataformas de desarrolladores en línea de sus caras que abarcan, dice la compañía, que describe el modelo como «de última generación» cuando se mide por varios puntos de referencia para comparar modelos abiertos.

El modelo viene en dos tamaños. Es un modelo GPT-ASS-20B más grande y más capaz que puede ejecutarse con una sola GPU NVIDIA, y un modelo GPT-OSS-20B ligero que puede ejecutarse en una computadora portátil de consumo con 16 GB de memoria.

El lanzamiento marca el primer modelo de lenguaje «abierto» de OpenAi desde GPT-2, que se lanzó hace más de cinco años.

En la sesión informativa, Openai dijo que, como informó TechCrunch anteriormente, los modelos abiertos pueden enviar consultas complejas a los modelos de IA en la nube. Esto significa que si los modelos abiertos de OpenAI no pueden hacer tareas específicas, como el procesamiento de imágenes, los desarrolladores pueden conectar los modelos abiertos a uno de los modelos cerrados más capaces de la compañía.

Modelos de IA de código abierto de OpenAI en sus primeros días, pero la compañía generalmente ha respaldado su propio enfoque para el desarrollo de la fuente de cierre. La última estrategia ayudó a construir grandes empresas de OpenAI que vendan acceso a modelos de IA a empresas y desarrolladores a través de API.

Pero el CEO Sam Altman dijo en enero que el Abierto cree que está «en el lado equivocado de la historia» cuando se trata de abrir su abastecimiento tecnológico. La compañía hoy enfrenta una creciente presión de los laboratorios de IA en China, incluidos Deepseek, Qwen y Moonshot AI de Alibaba, que ha desarrollado algunos de los modelos abiertos más capaces y populares del mundo. (Meta anteriormente dominó el espacio abierto de IA, pero el modelo Lama AI de la compañía estaba detrás del año pasado).

En julio, la administración Trump también instó a los desarrolladores estadounidenses a abrir más tecnologías para promover la adopción global de IA en línea con los valores estadounidenses.

Eventos de TechCrunch

San Francisco
|
27-29 de octubre de 2025

Con el lanzamiento de GPT-OSS, Operai espera que Curry favorezca tanto a los desarrolladores como a la administración Trump.

«De vuelta a cuando comenzamos en 2015, la misión de OpenAI es garantizar AGI que beneficien a toda la humanidad», dijo Altman en un comunicado compartido con TechCrunch. «Con ese fin, estamos entusiasmados de construir una pila de IA abierta creada en los EE. UU. Que está disponible para beneficiar a todos y ampliamente, según los valores democráticos».

Abre el CEO de AI Sam Altman — Crédito de la imagen: tomohiro ohsumi / getty imágenes

Cómo ejecutar el modelo

Operai tiene como objetivo hacer del modelo abierto un líder entre otros modelos de IA de peso abierto, y la compañía afirma que ha hecho exactamente eso.

CodeForces (con herramienta), prueba de codificación competitiva, puntajes GPT-ASS-120B y GPT-OSS-20B 2622 y 2516, superando a Deepseek’s R1 y debajo de O3 y O4-Mini.

El rendimiento del modelo abierto de OpenAI en CodeForces.Crédito de la imagen: OpenAI

El último examen de la humanidad (HLE) es una prueba desafiante de preguntas de crowdsourced que abarca una variedad de temas (con herramientas), GPT-OSS-120B y GPT-OSS-20B, 19% y 17.3% respectivamente. Del mismo modo, esto reduce el rendimiento del O3, pero es mejor que los principales modelos abiertos de Deepseek y Qwen.

El rendimiento del modelo abierto de Openai en HLE.Crédito de la imagen: OpenAI

En particular, los modelos abiertos de OpenAI se alucinan mucho más que los últimos modelos de inferencia de IA, O3 y O4-Mini.

El último modelo de inferencia de IA de OpenAI ha hecho alucinaciones aún más serias, y la compañía dijo anteriormente que no estaba muy claro por qué. En el Libro Blanco, Openai afirma: «Esto se espera porque los modelos más pequeños tienden a tener menos conocimiento del mundo y más alucinaciones que los modelos fronterizos más grandes».

Operai descubrió que el GPT-ASS-20B y GPT-OSS-20B alucinado en respuesta a cada una de las preguntas sobre Personqa, el punto de referencia interno de la compañía para medir la precisión del conocimiento modelo sobre las personas, en respuesta al 49% y 53%, respectivamente. Esto es más de tres veces mayor que el modelo O4-Mini, que tiene una tasa de alucinación del 16% para el modelo O1 de OpenAI, que ha alcanzado el 36%.

Entrenamiento de nuevos modelos

Operai dice que los modelos abiertos fueron entrenados en un proceso similar a sus propios modelos. La compañía dice que cada modelo abierto utilizará mezclas mixtas (MOE) para garantizar que ciertas preguntas tengan menos parámetros y se ejecuten de manera más eficiente. Para el GPT-OSS-20B con un total de 117 mil millones de parámetros, según OpenAI, este modelo tiene solo 5.1 mil millones de parámetros activos por token.

La compañía también afirma que su modelo abierto fue capacitado utilizando un gran grupo de GPU NVIDIA utilizando un alto aprendizaje de refuerzo métrico (RL), un proceso posterior a la capacitación para enseñar a los modelos de IA que se equivocan en un entorno simulado. También se utiliza para entrenar los modelos O de la O OpenAI, y los modelos abiertos tienen un proceso de mentalidad similar que requiere tiempo adicional y recursos computacionales para usar la respuesta.

Como resultado del proceso posterior a la capacitación, OpenAI dice que el modelo de IA Open es excelente para alimentar a los agentes de IA y puede invocar herramientas como la búsqueda web y la ejecución del código de Python como parte del proceso de la cadena de pensamiento. Sin embargo, Operai dice que el modelo abierto es solo de texto. Esto significa que no puede procesar o generar imágenes o audio como otros modelos de la empresa.

Operai está lanzando GPT-OSS-120B y GPT-OSS-20B bajo la licencia Apache 2.0. Esto generalmente se considera uno de los más tolerantes. Esta licencia permite a las empresas monetizar el modelo abierto de OpenAI sin tener que pagar u obtener permiso de la empresa.

Sin embargo, a diferencia de los productos de código abierto de AI Labs como AI2, OpenAI dice que no liberará datos de capacitación utilizados para crear modelos abiertos. Esta decisión no es sorprendente dado que varias demandas agresivas contra los proveedores de modelos de IA, incluido OpenAI, supuestamente estas compañías han capacitado incorrectamente modelos de IA para obras con derechos de autor.

Operai ha retrasado el lanzamiento de modelos abiertos varias veces en los últimos meses para abordar algunas preocupaciones de seguridad. Más allá de la política de seguridad típica de la compañía, Openai dijo en un libro blanco que también investigó si los malos actores ajustan el modelo GPT-OSS para ayudarlos con los ataques cibernéticos y la creación de armas biológicas o químicas.

Después de las pruebas de los evaluadores de OpenAI y de terceros, la compañía dice que GPT-oss podría aumentar ligeramente las capacidades biológicas. Sin embargo, no encontramos evidencia de que estos modelos abiertos pudieran alcanzar el umbral de riesgo de «alta capacidad» en estos dominios, incluso después de la fina ajuste.

Si bien los modelos de OpenAI se parecen a la vanguardia de los modelos abiertos, los desarrolladores esperan con ansias el lanzamiento del próximo modelo de inferencia de IA, el Deepseek R2 y el nuevo modelo abierto del laboratorio de superinteligencia de Meta.

Source link

What's Hot

CISA advierte que se está explotando activamente un defecto crítico en Lantronix EDS5000

Redes de malware Amadey y StealC interrumpidas y recuperadas 27 millones de credenciales robadas

OpenAI presenta el primer chip personalizado desarrollado por Broadcom

Operai lanza dos modelos de inferencia de IA «abiertos»

OpenAI presenta el primer chip personalizado desarrollado por Broadcom

Si desea reducir el tiempo frente a la pantalla, obtenga Brick

El camión eléctrico ultrasimple de Slate Auto comienza en $24,950

CISA advierte que se está explotando activamente un defecto crítico en Lantronix EDS5000

Redes de malware Amadey y StealC interrumpidas y recuperadas 27 millones de credenciales robadas

OpenAI presenta el primer chip personalizado desarrollado por Broadcom

Si desea reducir el tiempo frente a la pantalla, obtenga Brick

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

What's Hot

Operai lanza dos modelos de inferencia de IA «abiertos»

Cómo ejecutar el modelo

Entrenamiento de nuevos modelos

Related Posts