Desde el 4O de OpenAI hasta la difusión estable, los modelos de la Fundación AI que crean imágenes realistas a partir de indicaciones de texto ahora son abundantes. Por el contrario, los modelos básicos que pueden generar un entorno en línea 3D completo y coherente a partir de un mensaje de texto simplemente están surgiendo.
Aún así, la pregunta es cuando estos modelos están fácilmente disponibles. Matthias Niessner, actualmente uno de los investigadores de modelos AI 3D más destacados de Europa, tomó un permiso empresarial del Laboratorio Visual Computing & AI en el Instituto de Tecnología de Múnich, y descubrió que las nuevas empresas están trabajando en la región.
Niessner, anteriormente cofundador de Synthesia y una startup realista de AI Avatar valorada en $ 2.1 mil millones, ha obtenido una ronda de semillas inusualmente grande para la startup europea de $ 13 millones. La ronda fue dirigida por destacados inversores en etapa inicial en Europa (seguidores de Uipath, juegos máximos, etc.), con inversión de velocidad y participación de varios ángeles conocidos.
Su tamaño redondo es aún más impresionante teniendo en cuenta que Spaitial aún no tiene mucho que mostrar al mundo, aparte del video teaser recientemente lanzado que muestra cómo las indicaciones de texto generan habitaciones 3D.
Pero luego está el equipo técnico que reunió Niessner. Ricardo Martin-Brualla, quien anteriormente trabajó en la plataforma de teleconfencing 3D de Google, ahora se llama Beam. Y David Novotney pasó seis años en meta y dirigió el proyecto de generación de activos 3D del texto de la compañía.
Su experiencia colectiva les dará la oportunidad de luchar en un espacio que ya contiene algunos competidores con un enfoque similar en el fotorrealismo. Está Odyssey, que ha recaudado $ 27 millones y persiguió casos de uso de entretenimiento. Sin embargo, también está World Labs, una startup fundada por el pionero de AI Fei-Fei Li, que ya está valorada en más de $ 1 mil millones.
Niessner cree que esto todavía es principalmente competitivo en comparación con lo que existe en otros tipos de modelos básicos, pero también con respecto a la «visión más grande» que él y otros están persiguiendo.
«No solo quiero tener un mundo 3D. Quiero que este mundo actúe como un mundo real. Quiero cambiarlo y (tú) hacer algo.

Videojuegos para el mundo real
Nadie está realmente agrietado, incluso si la demanda de un entorno 3D fotorrealista lo es. La promesa de las oportunidades de «billones de dólares» de gemelos digitales a la realidad aumentada parece lo suficientemente grande como para excitar los VC, pero es ambiguo y multifacético, y lo suficientemente multifacético como para comprender la estrategia para el mercado. El caso de uso más obvio es la creación de videojuegos, pero estos modelos incluyen el uso del mundo real en campos como aplicaciones de entretenimiento, visualización 3D utilizada para estructuras y, en última instancia, capacitación robótica.
Niessner espera evitar el problema otorgando a los desarrolladores una licencia de modelo de fundación e diseñando aplicaciones posteriores para sus usos específicos. También alistó al ex ejecutivo de Kazoo, Lu Krogers, el cuarto cofundador de Palo Alto, mientras era profesor asistente visitante en la Universidad de Stanford.
Una de las primeras tareas con respecto a la hoja de ruta de Spaitial es identificar socios que puedan trabajar con modelos anteriores en comparación con modelos que necesitan esperar una mayor calidad.
«Quiero trabajar con al menos algunos de mis socios», dijo Niessner.
En comparación con otras nuevas empresas de IA bien financiadas, Spaitial está ganando dinero en su agenda. Pero primero, debe gastarlo tanto en cálculos como en empleo. En el último caso, su enfoque no está en la cantidad, sino en la calidad. Según Niessner, «el equipo no se convertirá en cientos de personas en el corto plazo. No es solo que no está sucediendo, no es necesario».
En cambio, Niessner y sus cofundadores están trabajando para crear espacios 3D más grandes e interactivos, por ejemplo, que el vidrio puede aplastar de manera realista. Esto desbloquea lo que Niessner llama «Santo Grial». Esto significa que puede ingresar el texto de 10 años y crear su propio videojuego en 10 minutos.
En su opinión, este objetivo ambicioso es más alcanzable de lo que realmente podría parecer una fruta de bajo costo, ya que la mayoría de las plataformas de juego tienen un control estricto sobre lo que terceros pueden agregar. Los usuarios pueden crear objetos 3D. Eso es como si Roblox pudiera, por supuesto, a menos que decidieran construirlo ellos mismos. Pero para entonces, Spaitial puede estar ocupado reemplazando los cads. Comienza el siguiente capítulo de la generación 3D.
Source link