Cuando los fundadores Ultimate Sammy Sidhu y Jay Cheer estaban trabajando como ingenieros de software en el programa de automóviles autónomos de Lyft, fueron testigos de problemas con la infraestructura de datos de elaboración de datos.
Los autos autónomos generan una gran cantidad de datos no estructurados, desde escaneos y fotos 3D hasta mensajes de texto y audio. No había una herramienta para los ingenieros de Lyft que pudieran entender y procesar todos estos diferentes tipos de datos al mismo tiempo. Esto ha resultado en que los ingenieros unan herramientas de código abierto en un proceso largo con problemas de confiabilidad.
«Obtuvimos todos estos grandes doctorados y tuvimos grandes personas de toda la industria, pero estamos trabajando en autos autónomos, y pasan el 80% de nuestro tiempo trabajando en infraestructura en lugar de construir aplicaciones centrales». «Y la mayoría de estos problemas que enfrentaban eran sobre la infraestructura de datos».
Sidhu y Chia ayudaron a construir una herramienta interna de procesamiento de datos multimodales para LYFT. Cuando Sidhu intentó solicitar otro trabajo, descubre que el entrevistador continúa preguntándole sobre la posibilidad de construir la misma solución de datos para su empresa, y nació la idea detrás del final.
En última instancia, creamos un motor de procesamiento de datos de código abierto para Python-Native, conocido como DAFT. Está diseñado para funcionar rápidamente en una variedad de modalidades, desde texto hasta audio y video. Sidhu dijo que SQL se trata de convertir DAFT como una infraestructura de datos no estructurada, similar a los conjuntos de datos tabulares en el pasado.
La compañía fue fundada a principios de 2022, casi un año antes de que se lanzara CHATGPT, antes de que muchas personas se dieran cuenta de esta brecha de infraestructura de datos. Lanzaron su primera versión de código abierto de la versión DAFT en 2022, y se están preparando para lanzar un producto empresarial en el tercer trimestre.
«La explosión de ChatGPT, lo que vimos es muchas otras personas que construyen aplicaciones de IA con diferentes tipos de modalidades», dice Sidhu. «Luego comenzamos a obtener como todos usaban imágenes, documentos, videos, etc. en sus aplicaciones. Ahí es donde el uso se vio dramáticamente (aumentando)».
La primera idea detrás de los edificios de Daft, que se originó en el espacio de autos autónomos, es el hogar de muchas otras industrias que procesan datos multimodales, como robótica, tecnología minorista y atención médica. La compañía actualmente cuenta Amazon, Cloudkitchens y juntos como sus clientes.
Finalmente, recientemente recaudé dos rondas de financiación en ocho meses. El primero fue una ronda de semillas de $ 7.5 millones dirigida por CRV. Más recientemente, recaudaron una ronda Serie A de $ 20 millones dirigida por Felicis con la participación de Microsoft’s M12 y Citi.
Esta última ronda se dirigirá a la creación de productos comerciales que no solo mejoren la oferta de código abierto de Eventual, sino que también permitirán a los clientes crear aplicaciones de IA a partir de estos datos procesados.
La socia general de Felicis, Astasia Myers, le dijo a TechCrunch que finalmente descubrió a través de un ejercicio de mapeo de mercado que implicaba la búsqueda de una infraestructura de datos que pudiera respaldar el aumento de los modelos de IA multimodales.
Myers dijo que finalmente se destacó porque era el primer motor del espacio, esto podría estar aún más concurrido, y basado en el hecho de que los fundadores abordaron este problema de procesamiento de datos directamente. Agregó que el problema final también es resolver problemas de creciente.
Se proyecta que la industria de IA multimodal crecerá a una tasa de crecimiento anual combinada del 35% entre 2023 y 2028, según la firma de consultoría de gestión Marketsandmarkets.
«En los últimos 20 años, la generación de datos anuales ha aumentado en 1,000 veces, con el 90% de los datos del mundo generados en los últimos dos años, y la mayoría de los datos no se estructuran, según IDC», dijo Myers. «Se adapta a esta enorme tendencia macro de la IA de la generación construida alrededor de texto, imágenes, video y audio. Requiere un motor de procesamiento de datos nativo multimodal».
Source link
