Richard Socher ha sido durante mucho tiempo una figura destacada en IA, mejor conocido por fundar la startup de chatbot You.com y por su trabajo anterior en Imagenet. Ahora, se une a la generación actual de startups de IA centradas en la investigación con Recursive Superintelligence, una startup con sede en San Francisco que surgió de la nada con 650 millones de dólares en financiación el miércoles.
Socher se une a destacados investigadores de IA en esta nueva empresa, incluidos Peter Norvig y el cofundador de Cresta, Tim Shi. Trabajan juntos para crear modelos de IA que se automejoran de forma recursiva. El modelo puede identificar de forma autónoma sus debilidades y rediseñarse para solucionarlas sin intervención humana. Este es un objetivo de larga data de la investigación moderna en IA.
Hablé con él por Zoom después del lanzamiento para profundizar en el enfoque técnico único de Recursive y por qué no considera este nuevo proyecto como un neolaboratorio (un término informal para una nueva generación de nuevas empresas de IA que priorizan la investigación sobre la construcción de productos).
Esta entrevista ha sido editada para mayor extensión y claridad.
Últimamente he oído mucho sobre la recursividad. Esto parece un objetivo muy común en los diferentes laboratorios. ¿Cuál crees que es tu enfoque único?
Nuestro enfoque único es aprovechar la apertura para alcanzar una superación personal recursiva que nadie ha logrado todavía. Es un objetivo difícil de alcanzar para muchos. Mucha gente ya asume que simplemente haciendo una investigación automatizada esto sucederá. Puedes pedirle a la IA que mejore otras cosas. Podría ser un sistema de aprendizaje automático, o simplemente una carta que escribiste, o cualquier otra cosa. Pero no se trata de una superación personal reflexiva. Es sólo una mejora.
Nuestro objetivo principal es construir una superinteligencia a escala verdaderamente recursiva y automejorable. Esto significa que todo el proceso de ideación, implementación y validación de ideas de investigación está automatizado.
Primero, ideas de investigación de IA (automatización) y, eventualmente, todo tipo de ideas de investigación, y eventualmente incluso en el dominio físico. Pero se vuelve especialmente poderoso cuando la IA trabaja sobre sí misma y desarrolla un nuevo tipo de conciencia de sus propios defectos.
Usaste la palabra abierto, ¿tiene algún significado técnico especial?
Así es. De hecho, uno de nuestros cofundadores, Tim Rocktäschel, dirigió el equipo de superación personal y de final abierto en Google DeepMind y, en particular, trabajó en el modelo mundial Genie 3, que es un gran ejemplo de final abierto. Puedes transmitir cualquier concepto, cualquier mundo, cualquier agente, y es interactivo con solo crearlo.
En la evolución biológica, los animales se adaptan a su entorno y luego otros animales se contraadaptan a esas adaptaciones. Es simplemente un proceso que puede evolucionar a lo largo de miles de millones de años y siguen sucediendo cosas interesantes, ¿verdad? Así es como desarrollamos los ojos (en nuestras cabezas).
Otro ejemplo es el equipo arcoíris de otro de los artículos de Tim. ¿Has oído hablar del Equipo Rojo?
En ciberseguridad, eso significa…
Por lo tanto, el equipo rojo también debe realizarse en un contexto de LLM. Básicamente, quiero que el LLM me enseñe cómo fabricar una bomba para que esto no suceda.
Ahora los humanos pueden sentarse allí durante mucho tiempo y encontrar ejemplos interesantes de lo que la IA no debería decir. Pero, ¿qué pasaría si probaras esta primera IA con una segunda IA, y a esa segunda IA se le encargara (intentar) hacer que la primera IA dijera todas las cosas malas posibles? Y puedes ir y venir a través de millones de iteraciones.
De hecho, puedes coevolucionar dos IA. Cuando un lado sigue atacando al otro, presenta muchos ángulos diferentes en lugar de solo uno, de ahí la analogía del arco iris. Y ahora que podemos recibir la primera vacuna contra la IA, será cada vez más segura. Esta fue idea de Tim Rocktaeschel y ahora se utiliza en los principales laboratorios.
¿Cómo sé que está hecho? Supongo que nunca se ha hecho.
Es posible que algunas de estas cosas nunca se hagan. Siempre puedes ser más inteligente. Siempre puedes mejorar en cosas como programación y matemáticas. La inteligencia tiene ciertos límites. De hecho, estoy intentando formalizarlos, pero las cifras son astronómicas. Estamos lejos de ese límite.
Siento que Neolab debería hacer algo que los principales laboratorios no están haciendo. Entonces, parte de la implicación aquí es que las grandes instituciones de investigación no creen que se alcance el RSI (automejora recursiva) haciendo lo que hacen. ¿Es eso justo?
Realmente no puedo comentar sobre lo que están haciendo, pero creo que estamos adoptando un enfoque diferente. Realmente abrazamos el concepto de apertura y nuestro equipo está completamente enfocado en esa visión. Y el equipo ha estado estudiando esto y publicando artículos en esta área durante los últimos 10 años. Y el equipo tiene un historial de realizar avances significativos en este espacio y enviar productos reales. Como sabes, Tim See convirtió el Cresta en un unicornio. Josh Tobin fue una de las primeras personas en OpenAI y finalmente dirigió los equipos de Codex y Deep Research.
De hecho, a veces tengo algunos problemas con esta categoría de neolab. Siento que somos más que un simple laboratorio de investigación. Queremos ser una empresa verdaderamente viable y ofrecer excelentes productos que la gente use y ame y que tengan un impacto positivo en la humanidad.
Entonces, ¿cuándo planea enviar su primer producto?
Lo pensé mucho. El equipo ha progresado tanto que es posible que incluso aceleren el cronograma que imaginaron originalmente. Pero sí, el producto llegará, pero habrá que esperar varios trimestres, no años.
Una forma de pensar en la superación personal recursiva es que cuando se introduce este tipo de sistema, la informática se convierte en el único recurso que importa. Cuanto más rápido se ejecute su sistema, más rápido mejorará. No existe ninguna actividad humana externa que realmente marque la diferencia. Entonces, la competencia es cuánta potencia de procesamiento puedes ponerle. ¿Crees que ese es el mundo hacia el que nos dirigimos?
Nunca subestimes la informática. En el futuro, creo que una pregunta muy importante será ¿cuánta potencia informática quieren utilizar los humanos para resolver qué problemas? Esto es cáncer, esto es virus. ¿Cuál quieres resolver primero? ¿Cuánta potencia informática quieres darle? En última instancia, todo se reduce a la asignación de recursos. Ésa sería una de las preguntas más importantes del mundo.
Si compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta la independencia editorial.
Source link
