Desde la calle, la única señal que pude encontrar de que era la sede de Inteligencia Física en San Francisco fue el símbolo pi en la puerta, que era de un color ligeramente diferente al del resto del edificio. Una vez dentro, inmediatamente encontrarás actividad. No hay mostrador de recepción ni ningún logotipo que brille bajo las luces fluorescentes.
En el interior, es una enorme caja de hormigón, con largas mesas de madera rubia dispuestas al azar, lo que la hace un poco menos solemne. Algunos son claramente para el almuerzo, llenos de cajas de galletas Girl Scout, frascos de Vegemite (aquí soy australiano) y pequeñas cestas de alambre llenas de demasiados condimentos. Las tablas restantes cuentan una historia completamente diferente. Muchos más de ellos están cargados con monitores, repuestos de robots, una maraña de cables negros y brazos robóticos completamente ensamblados en varios estados mientras intentan dominar lo mundano.
Durante mi visita, un brazo dobla, o intenta doblar, un par de pantalones negros. No funciona. El otro es alguien que está tratando de ponerse la camisa del revés con tal determinación que sugiere que lo logrará no sólo hoy, sino también con el tiempo. En tercer lugar, se supone que debes pelar rápidamente los calabacines y poner las virutas en un recipiente aparte. Al menos las virutas van por buen camino.
“Piense en ello como ChatGPT, pero para robots”, me dijo Sergey Levine, señalando el ballet motorizado que se desarrolla en la sala. Levine, profesor asociado de la Universidad de California, Berkeley y uno de los cofundadores de Inteligencia Física, tiene el comportamiento afable y con gafas de alguien que ha pasado un tiempo considerable explicando conceptos complejos a personas que no los entienden de inmediato.

Explica que lo que estoy viendo es la fase de prueba de un bucle continuo. Los datos se recopilan en estaciones robóticas aquí y en otros lugares, en almacenes, en casa y en cualquier lugar donde los equipos puedan instalarse, y los datos se utilizan para entrenar modelos basados en robots de uso general. Una vez que los investigadores entrenan un nuevo modelo, regresan a estas estaciones para su evaluación. La carpeta de pantalones es el experimento de alguien. Lo mismo ocurre con darle la vuelta a la camisa. Un pelador de calabacines podría estar probando si el modelo se puede generalizar a una variedad de verduras, aprendiendo los movimientos básicos del pelado para poder manipular con éxito manzanas y patatas que nunca antes había encontrado.
La compañía también opera cocinas de prueba en este edificio y otras ubicaciones utilizando hardware disponible para exponer a los robots a diferentes entornos y desafíos. Hay una sofisticada máquina de café expreso cerca y crees que es para el personal hasta que Levin aclara: «No, está ahí para que los robots aprendan». El café con leche espumoso es todo información, no un beneficio para las docenas de ingenieros en el sitio que en su mayoría miran computadoras y observan experimentos mecanizados.
El hardware en sí es intencionalmente modesto. Las armas se venden por unos 3.500 dólares, lo que incluye lo que Levine describió como un «enorme margen de beneficio» por parte del vendedor. Si se fabricara internamente, los costos de material se reducirían a menos de $1000. Hace unos años, afirma, los expertos en robótica se habrían sorprendido al ver lo que podían hacer estos robots. Pero ese es el punto. La buena inteligencia compensa el mal hardware.
evento de crisis tecnológica
bostón, massachusetts
|
23 de junio de 2026
Mientras Levine se disculpaba, Laci Groom se acercó a mí, moviéndose por el espacio con la determinación de alguien que tiene seis cosas sucediendo a la vez. A sus 31 años, Groome todavía tiene el aire refrescante de una maravilla de Silicon Valley, un título que obtuvo desde el principio (de ahí la descripción de Vegemite), fundando su primera empresa a los 13 años en su Australia natal y vendiéndola nueve meses después.
Cuando hablé con él por primera vez mientras daba la bienvenida al edificio a algunos visitantes vestidos con sudaderas, su respuesta inmediata a mi solicitud de pasar tiempo con él fue: «No, tengo una reunión». Ahora sólo tiene 10 minutos.
Groom encontró lo que estaba buscando cuando comenzó a seguir la investigación académica que salía del laboratorio de Levine y Chelsea Finn. Finn, ex estudiante de doctorado de Levine en Berkeley, ahora dirige su propio laboratorio en la Universidad de Stanford especializado en aprendizaje robótico. Sus nombres seguían apareciendo en todo tipo de cosas interesantes que sucedían en robótica. Cuando escuchó rumores de que podrían estar iniciando algo, localizó a Karol Hausman, investigadora de Google DeepMind y profesora de la Universidad de Stanford que sabía que Groom estaba involucrado. «Fue una de esas reuniones en las que sales y dices: ‘Esto es todo'».
Dado su historial, algunos podrían preguntarse por qué no se convirtió en un inversionista de tiempo completo, pero Groom nunca tuvo la intención de convertirse en un inversionista de tiempo completo, me dijo. Después de dejar Stripe, donde fue uno de los primeros empleados, pasó unos cinco años como inversor ángel, haciendo apuestas tempranas en empresas como Figma, Notion, Ramp y Lattice mientras buscaba la empresa adecuada para iniciar o unirse. Su primera inversión en un robot, Standard Bot, tuvo lugar en 2021 y lo reintrodujo en el campo que amaba cuando era niño: construir LEGO Mindstorms. Como bromea, «pasé mucho más tiempo de vacaciones como inversor». Pero invertir era sólo un medio para mantenerse activo y conocer gente, no el objetivo final. «Estuve buscando una empresa durante cinco años antes de que comenzara después de la creación de franjas», dice. «Las buenas ideas en el momento adecuado y con un buen equipo son muy raras. Todo es cuestión de ejecución, pero una mala idea se puede ejecutar como loca. Sigue siendo una mala idea».

La compañía de dos años ha recaudado más de mil millones de dólares y cuando se le preguntó sobre su pista, se apresuró a aclarar que en realidad no está en llamas. La mayor parte del gasto se destina a la informática. Poco después admitió que con las condiciones adecuadas y el socio adecuado podría recaudar más dinero. «Realmente no hay límite en cuanto a la cantidad de dinero que puedes invertir», dice. «Siempre hay más computación para resolver el problema».
Lo que hace que este acuerdo sea particularmente inusual es lo que Groom no ha ofrecido a sus seguidores: un cronograma para convertir la inteligencia física en una tarea para ganar dinero. «No respondo a la comercialización para los inversores», dice sobre patrocinadores como Khosla Ventures, Sequoia Capital y Thrive Capital, que valoraron la empresa en 5.600 millones de dólares. «Es un poco extraño que la gente tolere eso». Pero lo toleran y no siempre es así. Por eso es obligatorio que la empresa tenga capital suficiente ahora.
Entonces, ¿cuál es la estrategia sino la comercialización? Quan Vuong, otro cofundador de Google DeepMind, explica que gira en torno al aprendizaje cruzado y diversas fuentes de datos. Si alguien construye una nueva plataforma de hardware mañana, no necesita comenzar a recopilar datos desde cero. Puedes transferir todo el conocimiento que tu modelo ya tiene. «El coste marginal de introducir autonomía en una nueva plataforma robótica es mucho menor, sin importar cuál sea la plataforma», afirma.
La compañía ya está trabajando con un puñado de empresas en una variedad de industrias, incluida la logística, una tienda de comestibles y el fabricante de chocolate al otro lado de la calle, para probar si sus sistemas son lo suficientemente buenos para la automatización en el mundo real. Vuong sostiene que en algunos casos esto ya es así. Con un enfoque de «cualquier plataforma, cualquier tarea», las posibilidades de éxito son lo suficientemente amplias como para que pueda comenzar a comprobar las tareas que están listas para la automatización hoy mismo.
La inteligencia física no es lo único que persigue esta visión. Al igual que el modelo LLM que cautivó al mundo hace tres años, la carrera para construir inteligencia robótica de propósito general se está intensificando, proporcionando la base sobre la cual se pueden construir aplicaciones más especializadas. Skild AI, una empresa con sede en Pittsburgh fundada en 2023 que solo este mes recaudó 1.400 millones de dólares con una valoración de 14.000 millones de dólares, está adoptando un enfoque marcadamente diferente. Si bien la inteligencia física sigue centrándose en la investigación pura, Skild AI ya ha implementado comercialmente su Skild Brain «multipropósito», y dice que generó 30 millones de dólares en ingresos en seguridad, almacenamiento y fabricación en tan solo unos meses el año pasado.

Skild atacó públicamente a sus competidores, argumentando en una publicación de blog que la mayoría de los «modelos básicos de robótica» son simplemente modelos de lenguaje visual «transformados» que carecen de «verdadero sentido común físico» porque dependen demasiado del entrenamiento previo a escala de Internet en lugar de simulaciones físicas o datos robóticos reales.
Ésa es una división filosófica bastante marcada. Skild AI apuesta a que la implementación comercial creará un volante de datos que mejore los modelos para cada caso de uso del mundo real. La Inteligencia Física apuesta a que resistiendo las tentaciones de la comercialización a corto plazo, podemos crear una inteligencia general superior. Se necesitarán años para resolver cuál es «más correcto».
Mientras tanto, la inteligencia física opera con lo que Gloom describe como una claridad inusual. «Es una empresa muy pura. Los investigadores tienen necesidades y recopilamos datos para satisfacer esas necesidades, y lo hacemos con hardware nuevo y lo que sea. No está impulsado externamente». La empresa tenía una hoja de ruta de cinco a diez años para lo que el equipo pensaba que era posible. A los 18 meses, dice, lo habían arruinado.
La empresa tiene alrededor de 80 empleados y planea seguir creciendo, pero Groom dijo que espera hacerlo «lo más lentamente posible». La parte más difícil, afirma, es el hardware. «El hardware es realmente complicado. Todo lo que hacemos es mucho más complicado que el de una empresa de software». El hardware se rompe. Llegue tarde y el examen se retrasará. Todo se complica cuando se piensa en la seguridad.
Vi a los robots continuar practicando mientras el novio se levantaba y se apresuraba hacia su siguiente misión. Los pantalones aún no están doblados. La camiseta permanece obstinadamente del lado derecho. Las virutas de calabacín se van apilando muy bien.
Hay preguntas obvias, incluido yo mismo, sobre si alguien realmente querría usar un robot pelador de verduras en la cocina, sobre la seguridad, sobre los perros que se vuelven locos cuando las máquinas entran en la casa y sobre si todo el tiempo y el dinero invertidos aquí resolverán problemas suficientemente grandes o crearán otros nuevos. Mientras tanto, los externos tienen dudas sobre el progreso de la empresa, si su visión es realizable y si tiene sentido apostar por la inteligencia general en lugar de aplicaciones específicas.
Aunque el novio tenga dudas, no las demuestra. Está trabajando con personas que han estado trabajando en este problema durante décadas y creen que finalmente ha llegado el momento adecuado, y eso es todo lo que necesita saber.
Además, Silicon Valley ha apoyado a personas como los novios desde los primeros días de la industria, dándoles mucha cuerda. Incluso si no tienen un camino claro hacia la comercialización, incluso si no tienen un cronograma, incluso si no están seguros de cómo será el mercado cuando lleguen allí, saben que probablemente lo descubrirán. No siempre funciona. Pero cuando lo hacemos, tendemos a justificar muchas de las veces que no lo hacemos.
Source link
