Solo unos meses después de enviar ondas de choque a través de la industria de la tecnología, la startup china de IA Deepseek ha regresado con otra sorpresa. Esta vez no había sonido.
Sin anuncios oficiales o impulso de los medios, Deepseek subió silenciosamente una versión actualizada para enfrentar la cara, un repositorio público de IA. Este es el último movimiento de la compañía que apareció en los titulares a principios de este año después de que el modelo R1 original superó los pesos pesados como Meta y OpenAI.
Tasa de huelgas de Deepseek: la startup de IA china libera en silencio nuevos modelos R1 con soporte de codificación de ambas
En enero, Deepseek superó a ChatGPT, convirtiéndose en la aplicación gratuita más calificada en la App Store de Apple en los EE. UU., Con su lanzamiento el 10 de enero causando revuelo a través de la industria tecnológica. El modelo de código abierto de Deepseek no solo supera su peso, sino que también lo hizo en pequeños presupuestos y tiempos de registro. ¿resultado? Panic en todo el mercado, preguntas perspicaces sobre el gasto de IA en los EE. UU. Y un golpe temporal a la confianza de los inversores en los jugadores clave de IA, incluido Nvidia. El mercado ha sido rebotado para la mayoría, pero el ascenso de Deepseek sirvió como una llamada de atención.
Ahora el modelo R1 actualizado está aquí. Y una vez más, está volando debajo del radar.
Según Deepseek, el modelo mejorado ha logrado fuertes resultados entre matemáticas, codificación e interfaz de referencia, colocándolo en distancias prominentes de los mejores artistas como Openi’s O3 y Gemini 2.5 Pro.
«El modelo Deepseek R1 ha sufrido actualizaciones de versión menores, con la versión actual de Deepseek-R1-0528. En la última actualización, Deepseek R1 ha mejorado significativamente la profundidad de la inferencia y la inferencia con el aumento de los recursos computacionales y la introducción de un mecanismo de optimización algorítmica durante el entrenamiento posterior.
La versión más nueva de Deepseek R1 se clasifica justo detrás de O4-Mini y O3 de OpenAi de LivecodeBench. Este es un sitio de referencia que evalúa las capacidades de inferencia de modelos de idiomas grandes. Estos tipos de modelos están diseñados para manejar tareas más complejas a través del pensamiento lógico y paso a paso.
En una publicación sobre Huggingface, Deepseek escribió:
En comparación con las versiones anteriores, el modelo actualizado muestra mejoras significativas en el manejo de tareas de inferencia compleja. Por ejemplo, en las pruebas AIME 2025, la precisión del modelo ha aumentado de 70% en la versión anterior a 87.5% en la versión actual. Este avance se atribuye a una mayor profundidad de pensamiento durante el proceso de inferencia. En el conjunto de pruebas de AIME, los modelos anteriores utilizaron un promedio de 12k tokens por pregunta, mientras que en la versión más nueva promedia 23k tokens por pregunta. Más allá de las capacidades de inferencia mejoradas, esta versión también ofrece una tasa de alucinación más baja, un mayor soporte para las llamadas de funciones y una mejor experiencia de codificación de vibos. «
Deepseek se ha convertido rápidamente en un símbolo de la presencia de China en la IA. Y lo está haciendo bajo restricciones cada vez más estrictas. Estados Unidos ha establecido restricciones en el acceso a los chips de alta gama de China y espera frenar ese progreso. Pero hasta ahora, la apuesta no se ha valido la pena.
Justo este mes, los gigantes tecnológicos Baidu y Tencent compartieron una actualización sobre cómo hacer que el modelo sea más eficiente como una forma de evitar las limitaciones de hardware causadas por los controles de exportación de los Estados Unidos.
El CEO de NVIDIA, Jensen Huang, se negó a comentar sobre el tema recientemente.
«Estados Unidos se basa en la suposición de que China no puede hacer chips de IA», dijo Huang. «Esa suposición siempre ha sido cuestionable y claramente está equivocada ahora», informó CNBC.
«La pregunta no es si China tiene IA o no», agregó. «Ya es cierto».
El desarrollo tranquilo del nuevo modelo de Deepseek puede parecer sutil, pero el mensaje es fuerte y claro. China no está esperando permiso. Es un edificio.
¿Comparta la historia?
Envíe sus historias a TechStartups.com frente a miles de fundadores, inversores, compañías de educación física, ejecutivos de tecnología, tomadores de decisiones y líderes tecnológicos.
Atraer la atención
Source link