Zayn Asghar, profesor adjunto de la Universidad de Stanford y exitoso fundador, ha recaudado 80 millones de dólares en la Serie A para una startup que resuelve inteligentemente el problema del cuello de botella de la inferencia de la IA. La ronda estuvo liderada por Menlo Ventures.
Una empresa llamada Gimlet Labs ha desarrollado la primera y única «nube de inferencia multisilicio», un software que permite que cargas de trabajo de IA se ejecuten en diferentes tipos de hardware simultáneamente. Puede dividir el trabajo de sus aplicaciones de IA entre CPU tradicionales y GPU adaptadas a IA, así como sistemas de alta memoria.
«Básicamente nos topamos con diferentes hardware disponibles», dijo Asghar a TechCrunch.
Un solo agente puede encadenar múltiples pasos, cada uno de los cuales «requiere hardware diferente: la inferencia depende de la computación, la decodificación depende de la memoria y la invocación de la herramienta depende de la red», escribió el inversionista principal de Menlo, Tim Tully, en una publicación de blog sobre la financiación.
Todavía no hay un chip para hacerlo todo, pero a medida que se implementa nuevo hardware y se reimplementan las GPU obsoletas, «una flota multisilicio está lista. Sólo nos falta la capa de software para que funcione». Eso es lo que Tully cree que logrará el Instituto Gimlet.
Si continúan las tendencias actuales en la implementación de más computación, McKinsey estima que el gasto en centros de datos alcanzará casi 7 billones de dólares para 2030. Asghar dijo que la aplicación sólo utiliza el hardware existente ya implementado «entre el 15 y el 30 por ciento» del tiempo.
«La otra forma de pensar en esto es que se están desperdiciando cientos de miles de millones de dólares simplemente por dejar recursos inactivos», dijo. «Nuestro objetivo era esencialmente descubrir cómo hacer que las cargas de trabajo de IA sean 10 veces más eficientes hoy que nunca».
evento de crisis tecnológica
San Francisco, California
|
13-15 de octubre de 2026
Entonces, él y los cofundadores Michelle Nguyen, Omid Azizi y Natalie Serrino se propusieron crear software de orquestación que pudiera dividir las cargas de trabajo de los agentes y distribuirlas en todo tipo de hardware simultáneamente.
Gimlet Labs afirma que puede acelerar de manera confiable la inferencia de IA entre 3 y 10 veces por el mismo costo y potencia. Gimlet dice que el modelo subyacente también se puede dividir para ejecutarlo en diferentes arquitecturas, utilizando el mejor chip para cada parte del modelo.
La compañía ya tiene asociaciones con fabricantes de chips como NVIDIA, AMD, Intel, ARM, Cerebras y d-Matrix.
Los productos de Gimlet, proporcionados como software o a través de API a nuestra Gimlet Cloud patentada, no están destinados a desarrolladores de aplicaciones de IA en general. Esto es para los laboratorios de modelos de IA y centros de datos más grandes.
La compañía salió a bolsa en octubre y dice que ha logrado ingresos de ocho cifras (o al menos 10 millones de dólares) desde su creación. Asghar dijo que la base de clientes se ha más que duplicado en los últimos cuatro meses y ahora incluye a los principales fabricantes de modelos y empresas muy grandes de computación en la nube, pero se negó a nombrarlos.
Los cofundadores trabajaron juntos anteriormente en Pixie, una startup que desarrolló herramientas de observabilidad de código abierto para Kubernetes. Pixie fue adquirida por New Relic en 2020, solo dos meses después de su lanzamiento en una Serie A de $ 9 millones liderada por Benchmark. (La tecnología de Pixie ahora es parte de la organización de código abierto que supervisa Kubernetes).
Después de que Asghar conoció a Talley por casualidad hace aproximadamente un año y recibió una inversión ángel de profesores de Stanford, los capitalistas de riesgo comenzaron a llamar. Después del comienzo, llegó una hoja de condiciones al escritorio de Asgar. Cuando los capitalistas de riesgo se enteraron de que Asghar estaba considerando una oferta, la ronda rápidamente llegó al máximo porque «teníamos bastante dinero», dijo.
Con la semilla anterior, la startup ha recaudado un total de 92 millones de dólares de varios ángeles, incluido Bill Coughran de Sequoia, el profesor de Stanford Nick McKeown, el ex director ejecutivo de VMware Raghu Raghuram y el director ejecutivo de Intel, Lip-Bu Tan. La empresa emplea actualmente a 30 personas.
Otros inversores incluyen Factory, que lideró la semilla, Eclipse Ventures, Prosperity7 y Triatomic.
Source link
