El impulso para descubrir el próximo gran avance en IA ha financiado algunos proyectos bastante ambiciosos, pero una empresa ve esto como una oportunidad para reconstruir su arquitectura informática desde cero.
La IA no convencional, dirigida por el ex director de IA de Databricks, Naveen Rao, promete mejorar significativamente la eficiencia energética del procesamiento de inferencia. El arma secreta: un nuevo tipo de arquitectura informática basada en osciladores.
El jueves, la compañía lanzó su primer modelo de IA, llamado Un-0. Esta es la primera herramienta del sistema de generación de imágenes que demuestra cómo la tecnología de la empresa puede replicar los sistemas de IA tradicionales. El nuevo artículo adjunto detalla cómo el equipo de investigación de la compañía construyó un modelo de generación de imágenes completamente funcional utilizando simulaciones de software de una nueva arquitectura que funciona a la par con los modelos de difusión de última generación.
«Este es el ‘Hola mundo’ de un nuevo tipo de computadora», dijo Rao a TechCrunch. «Durante el próximo año, comenzaremos a ver algunas noticias bastante interesantes al respecto».
El resultado del nuevo modelo Un-0 es similar al de los modelos de generación de imágenes como Stable Diffusion y GPT Image 1 de OpenAI. Lo impresionante es cómo llegan a ese rendimiento. Este modelo se basa en una arquitectura basada en osciladores que es completamente diferente de la informática tradicional y de los chips que impulsan los LLM tradicionales. Aunque los beneficios de la computación basada en osciladores son complejos, Rao cree que, en última instancia, puede reducir el uso de energía hasta 1.000 veces.
Gran parte de la infraestructura para llegar hasta allí aún se está construyendo. La versión actual de Un-0 se ejecuta en una simulación de software del chip oscilador de Unconventional, pero la compañía planea publicar pronto un esquema del chip real. A partir de ahí, el plan es construir toda la pila de inferencia desde cero y, finalmente, hacer que la IA no convencional ofrezca la misma potencia informática que otros proveedores.
«Estamos construyendo un nuevo tipo de sistema hecho con nuestros chips», dice Rao. «Ejecutamos el modelo de IA allí y utilizamos cables de red para recibir indicaciones y enviar inferencias, y funciona con 1/1000 de potencia».
Se trata de un objetivo increíblemente ambicioso, especialmente para una empresa con menos de 50 empleados. Pero dada la escala a la que se está construyendo la IA y los costos esperados de satisfacer las crecientes demandas de inferencia, este puede ser uno de los pocos esfuerzos para abordar la magnitud del problema. En opinión de Rao, el suministro de energía disponible será una de las graves limitaciones para la IA en los próximos años. Y Unconventional es uno de los pocos proyectos que puede abordar eso.
«Es difícil ampliar la IA debido a la energía. Este será un límite fundamental en los próximos años. No podemos ir más allá. Al final del día, será un problema de energía limitada», afirma.
Si compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta la independencia editorial.
Source link
