Demis Hassabis, CEO del Instituto de Investigación de IA de Google, Deepmind, parece haber insinuado que el último modelo de generación de videos de Google, VEO 3, podría usarse para videojuegos el martes por la noche.
Cuando le pregunté a Google, «Permítanme jugar un videojuego con Veo 3 Video», Hassavis respondió: «¿Qué modelado mundialmente jugable?»
El miércoles por la mañana, Logan Kilpatrick, el producto principal de AI Studio de Google y la API de Géminis, sonó con la respuesta «🤐🤐🤐🤐».
Ambas publicaciones de los ejecutivos de Google no son más que sugerencias lúdicas, y un portavoz de Google le dijo a TechCrunch que no hay nada que compartir en este momento. Pero construir modelos mundiales jugables no está fuera del reino del potencial para los gigantes tecnológicos.
Los modelos mundiales difieren de los modelos de generación de videos. El primero simula la dinámica de los entornos del mundo real. Esto permite a los agentes predecir cómo evolucionará el mundo de acuerdo con sus acciones. El modelo de videógeno sintetiza secuencias de video realistas.
Google planea convertir el Gemini 2.5 Pro, un modelo de base multimodal, en un modelo mundial que simula aspectos del cerebro humano. En diciembre, Deepmind anunció el Genie 2. Este es un modelo que puede generar una variedad de mundos jugables «infinitos». Al mes siguiente, Google informó que estaba formando un nuevo equipo para abordar los modelos de IA que podrían simular el mundo real.
Otros están trabajando en la construcción de un modelo mundial. En particular, el pionero de IA Fei-Fei Li. Li salió de sigilo en World Labs el año pasado. Worldlabs es una startup que ha creado su propio sistema de IA que genera escenas 3D similares a videojuegos a partir de una sola imagen.
Todavía disponible, VEO 3 le permite crear video y audio para que coincida con el clip, desde discursos hasta bandas sonoras. VEO 3 crea un movimiento realista al simular la física real, pero ese aún no es un modelo mundial. En cambio, se puede usar para la narración de cine en juegos, como escenas, trailers y prototipos de historias
El modelo sigue siendo un modelo de generación de «salida pasiva», y él (o futuras generaciones VEO) debería pasar a un simulador más activo, interactivo y predictivo.
Pero el verdadero desafío para crear un videojuego es más que imágenes impresionantes. Una simulación en tiempo real, consistente y controlable. Es por eso que podría tener sentido ver a Google adoptar un enfoque híbrido que aprovecha a Veo y Genie en el futuro al perseguir videojuegos y el desarrollo mundial jugable.
Google iba a competir con Microsoft, Scenario, Runway, Pika y, en última instancia, el modelo de generación de videos de Openai Sora.
Dados los movimientos de Google planea en el espacio del modelo mundial y su reputación de usar sus bolsillos profundos y músculos de distribución para rodar a sus rivales con vapor, los competidores en este espacio serían sabios de prestar atención.
Source link
