Operai ha lanzado el O3-Pro, el modelo AI que la compañía afirma ser el más capaz de haber.
El O3-Pro es la versión O3 de OpenAI, un modelo de razonamiento lanzado por una startup a principios de este año. A diferencia de los modelos de IA tradicionales, los modelos de inferencia cuentan con problemas escenificados, lo que les permite funcionar de manera más confiable en dominios como física, matemáticas, codificación y más.
El O3-Pro estará disponible para los usuarios de ChatGPT Pro y del equipo a partir del martes y reemplazará el modelo O1-Pro. Los usuarios de Enterprise y EDU podrán acceder a él en una semana, dice Operai. O3-Pro también estará en vivo en la API de desarrollador de OpenAI esta tarde.
El precio de O3-Pro es de $ 20 por millón de tokens de entrada y $ 80 por millón de API de $ 1 millón. Un token de entrada es un token que se alimenta al modelo, y un token de salida es un token que el modelo genera en función del token de entrada.
Un millón de tokens de entrada equivale a unas 750,000 palabras, un poco más largas que la «guerra y la paz».
«En evaluaciones de expertos, los revisores siempre prefieren O3-Pro sobre O3-Pro en todas las categorías probadas, especialmente dominios principales como ciencia, educación, programación, negocios, escritura de ayuda», escribe Operai en ChangeLog. «Los revisores también elogiaron constantemente el O3-Pro por claridad, inclusión, instrucción de seguimiento y precisión».
Según OpenAI, O3-Pro tiene acceso a herramientas, lo que le permite buscar en la web, analizar archivos, personalizar razones para la entrada visual, usar Python, respuestas habilitadas en memoria y más. La desventaja es que según OpenAI, la respuesta del modelo suele ser más larga que la O1-Pro.
O3-Pro tiene otras limitaciones. El chat temporal con los modelos ChatGPT está actualmente deshabilitado, pero OpenAI resuelve «problemas técnicos». O3-Pro no puede generar imágenes. O3-Pro es compatible con el lienzo de la función de espacio de trabajo con IA de OpenAI no es compatible con O3-Pro.
En el lado positivo, según las pruebas internas de OpenAi, el O3-Pro ha logrado un puntaje impresionante en el popular punto de referencia de IA. En AIME 2024, que evalúa las habilidades matemáticas modelo, Gemini 2.5 Pro es el modelo de IA de mejor rendimiento de Google. El O3-Pro también derrota a la recientemente lanzada Opus de Claude 4 en GPQA Diamond, una prueba de conocimiento científico a nivel de doctorado.
Source link
