Cerrar menú
  • Inicio
  • Identidad
  • Inventos
  • Futuro
  • Ciencia
  • Startups
  • English
What's Hot

Los primeros signos de agotamiento provienen de quienes más adoptan la IA

Fortinet corrige una falla crítica de SQLi que permite la ejecución de código no autenticado

La empresa de MrBeast adquiere Step, la aplicación fintech centrada en la Generación Z

Facebook X (Twitter) Instagram
  • Home
  • Contáctenos
  • DMCA
  • Política de Privacidad
  • Sobre Nosotros
  • Términos y Condiciones
  • 📢 Anúnciate con Nosotros
  • Enviar publicaciones
FySelf Noticias
  • Inicio
  • Identidad
  • Inventos
  • Futuro
  • Ciencia
  • Startups
  • English
FySelf Noticias
Home»Startups»Deepseek libera un modelo de «advertencia escasa» que reduce los costos de API a la mitad
Startups

Deepseek libera un modelo de «advertencia escasa» que reduce los costos de API a la mitad

corp@blsindustriaytecnologia.comBy corp@blsindustriaytecnologia.comseptiembre 29, 2025No hay comentarios3 minutos de lectura
Share Facebook Twitter Pinterest Telegram LinkedIn Tumblr Email Copy Link
Follow Us
Google News Flipboard
Share
Facebook Twitter LinkedIn Pinterest Email Copy Link

El lunes, los investigadores de Deepseek publicaron un nuevo modelo experimental llamado V3.2-Exp, diseñado para reducir drásticamente los costos de inferencia cuando se usan en operaciones de contexto largas. Deepseek anunció el modelo en una publicación sobre los abrazos de Face y publicó un artículo académico vinculado a Github.

La característica más importante del nuevo modelo se llama Anterest SPARSE profundo. Este es un sistema complejo explicado en detalle en el diagrama a continuación. Esencialmente, el sistema utiliza un módulo llamado «Lightning Insider» para priorizar ciertos extractos desde la ventana de contexto. Otro sistema, llamado «Sistema de selección de token de grano fino», luego selecciona un token específico desde estos extractos y lo carga en la ventana de atención limitada del módulo. En resumen, los modelos de atención escasa pueden funcionar para que el servidor se cargue en secciones largas de contextos relativamente pequeños.

Captura de pantalla

Para las operaciones de contexto a largo plazo, las ventajas del sistema son importantes. Una prueba preliminar de Deepseek muestra que el precio de las llamadas de API simples puede reducirse a la mitad en largas situaciones de contexto. La construcción de una evaluación más sólida requerirá más pruebas, pero dado que los modelos son de peso abierto y están disponibles gratuitamente, no pasará mucho tiempo antes de que las pruebas de terceros puedan evaluar las reclamaciones hechas en el documento.

El nuevo modelo de Deepseek es uno de los avances recientes que abordan el tema de los costos de inferencia. Esencialmente, es el costo del servidor para manipular un modelo de IA previamente capacitado que es diferente del costo de la capacitación. En el caso de Deepseek, los investigadores buscaban formas de hacer que las arquitecturas básicas de transformadores funcionen de manera más eficiente.

Deepseek, con sede en China, fue una figura rara en el auge de la IA, especialmente aquellos que ven la investigación de la IA como una lucha nacionalista entre los Estados Unidos y China. La compañía hizo olas en el modelo R1 a principios de año, y recibió capacitación utilizando el aprendizaje de refuerzo, principalmente a un costo mucho menor que sus competidores estadounidenses. Sin embargo, este modelo no ha desencadenado una revolución mayorista en la capacitación de IA, como algunos han predicho. La compañía luego se retiró del centro de atención en esos pocos meses.

Es poco probable que el nuevo enfoque de «escasa atención» produzca el mismo alboroto que R1, pero puede enseñar a los proveedores los trucos necesarios para mantener bajos los costos de inferencia.


Source link

#Aceleradoras #CapitalRiesgo #EcosistemaStartup #Emprendimiento #InnovaciónEmpresarial #Startups
Follow on Google News Follow on Flipboard
Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Copy Link
Previous ArticleOperai se enfrenta a Google, Amazon con un nuevo sistema de compras de agentes
Next Article El reclutador AI Alex recauda $ 17 millones para automatizar su primera entrevista de trabajo
corp@blsindustriaytecnologia.com
  • Website

Related Posts

Los primeros signos de agotamiento provienen de quienes más adoptan la IA

febrero 10, 2026

La empresa de MrBeast adquiere Step, la aplicación fintech centrada en la Generación Z

febrero 9, 2026

El CEO de Databricks dice que SaaS no está muerto, pero la IA pronto lo hará inútil

febrero 9, 2026
Add A Comment
Leave A Reply Cancel Reply

el último

Los primeros signos de agotamiento provienen de quienes más adoptan la IA

Fortinet corrige una falla crítica de SQLi que permite la ejecución de código no autenticado

La empresa de MrBeast adquiere Step, la aplicación fintech centrada en la Generación Z

El CEO de Databricks dice que SaaS no está muerto, pero la IA pronto lo hará inútil

Publicaciones de tendencia

Suscríbete a las noticias

Suscríbete a nuestro boletín informativo y no te pierdas nuestras últimas noticias.

Suscríbete a mi boletín informativo para recibir nuevas publicaciones y consejos. ¡Manténgase al día!

Noticias Fyself es un medio digital dedicado a brindar información actualizada, precisa y relevante sobre los temas que están moldeando el futuro: economía, tecnología, startups, invenciones, sostenibilidad y fintech.

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

Facebook X (Twitter) Instagram Pinterest YouTube
  • Home
  • Contáctenos
  • DMCA
  • Política de Privacidad
  • Sobre Nosotros
  • Términos y Condiciones
  • 📢 Anúnciate con Nosotros
  • Enviar publicaciones
© 2026 noticias.fyself. Designed by noticias.fyself.

Escribe arriba y pulsa Enter para buscar. Pulsa Esc para cancelar.