La compañía de IA de AI de Elon Musk lanzó su último modelo de IA insignia, el Grok 4, el miércoles por la noche, y anunció Supergrok Heavy, un plan de suscripción de IA que cuesta $ 300 por mes.
Grok es la respuesta de Xai a modelos como el chatgpt de OpenAi y Gemini de Google, lo que le permite analizar imágenes y responder a las preguntas. En los últimos meses, Grok se ha integrado profundamente en la red social X de Musk, y recientemente adquirido por XAI. Pero también coloca los frentes y centros de fraude de Grok para millones de usuarios.
Hay altas expectativas para el GROK 4. Los últimos modelos de IA de Xai se apilan contra el próximo modelo AI GPT-5 de OpenAI, que está programado para ser lanzado a finales de este verano.
«Cuando se trata de preguntas académicas, Grok 4 es superior al nivel de doctorado en todos los temas, sin excepciones», dijo Elon Musk en una transmisión en vivo el miércoles por la noche. «A veces, puede faltar en sentido común, y aún no hemos inventado nuevas tecnologías o descubierto una nueva física, pero es solo cuestión de tiempo».

El lanzamiento de Grok 4 se encuentra en una semana tumultuosa para la compañía de Elon Musk. Más temprano el miércoles, Linda Jaccarino renunció a su papel de CEO de X después de unos dos años en la compañía. X aún no ha anunciado a su sucesor.
La partida de Yaccarino se produce días después de que el funcionario oficial de Grok, la cuenta X Automated, respondiera a los usuarios con comentarios antisemitas que critican a los «ejecutivos judíos» de Hollywood y elogiaron a Hitler. Xai tuvo que restringir fácilmente las cuentas de Grok y eliminar publicaciones ofensivas. En respuesta al incidente, parecía que Xai había eliminado la sección recientemente agregada del mensaje del sistema público de Grok, una lista de instrucciones que el chatbot AI debería seguir.
Los líderes de Musk y Xai rechazaron en gran medida el incidente, en lugar de centrarse en el rendimiento y las capacidades del Grok 4.
El miércoles, Xai lanzó dos modelos: el Grok 4 y Grok 4 Heavy, la «versión de múltiples agentes» de la compañía que ofrece un rendimiento mejorado. Musk argumentó que el desove pesado de Grok 4 haría que múltiples agentes trabajen simultáneamente para trabajar múltiples agentes al mismo tiempo, y luego todos insistieron en comparar sus obras «como un grupo de investigación» para encontrar la mejor respuesta.
La compañía afirma que el Grok 4 ha mostrado un rendimiento de nivel fronterizo en varios puntos de referencia, incluido el examen final para la humanidad. Esta es una prueba desafiante que mide la capacidad de la IA para responder a miles de preguntas de crowdsourced sobre materias como matemáticas, humanidades y ciencias naturales. Según Xai, el Grok 4 ganó 25.4%en el examen final de la humanidad sin una «herramienta», superando a Gemini 2.5 Pro de Google, que ganó el 21.6%, y el O3 de OpenAI (alto), que ganó el 21%.
XAI afirma que el Grok 4 pesado con las «herramientas» puede lograr una puntuación del 44.4%, superando al Gemini 2.5 Pro utilizando herramientas, que obtuvieron un 26.9%.
El premio ARC sin fines de lucro dice que Grok está logrando nuevos puntajes de vanguardia en la prueba ARC-AGI-2. Este es otro punto de referencia difícil que consiste en problemas similares a los rompecabezas donde la IA necesita identificar patrones visuales, ganando 16.2%. Esto es casi el doble del puntaje para el próximo mejor modelo de IA comercial, el Claude Opus 4.

Junto con el Grok 4 y Grok 4 Heavy, Xai ha lanzado sus planes de suscripción de IA más caros. Esto lanzó una suscripción de $ 300/mes llamada Supergrok Heavy. Los suscriptores de planificación obtendrán una vista previa temprana de GROK 4 acceso pesado y temprano a nuevas características. El plan es similar al nivel Ultra-Premium ofrecido por Operai, Google y Humanidad, pero Xai actualmente ofrece la suscripción más cara de los principales proveedores de IA.
Los suscriptores de Supergrok Heavy pueden tener acceso temprano a algunos productos nuevos que Xai se lanzará en los próximos meses. La compañía dijo el miércoles que los modelos de codificación de IA llegarán en agosto, un agente multimodal en septiembre y un modelo de generación de videos en octubre.
XAI está lanzando Grok 4 a través de API para permitir a los desarrolladores construir aplicaciones utilizando modelos. La compañía señala que el sector empresarial de Xai tiene solo dos meses. Sin embargo, planeamos trabajar con HyperSchool para hacer que Grok esté disponible a través de nuestra plataforma en la nube.
A pesar del rendimiento de nivel fronterizo de Grok en puntos de referencia, puede ser difícil para Xai superar el reciente desastre cuando Xai intenta vender a Grok a las empresas como un verdadero candidato para ChatGPT, Claude y Gemini. Todavía no está claro si las empresas están listas para adoptar Grok, defectos, etc.
Source link
