El viernes, el creador de Claude Code, Boris Cherny, apareció en la conferencia @Scale de Meta. Sorprendentemente, la primera pregunta del público fue sobre los bucles.
El interrogador preguntó: «¿Es The Loop el próximo ciclo de publicidad? ¿O es real?».
La respuesta de Charney fue enfática: «Sí, eso es cierto».
«Hace dos años, escribimos nuestro código fuente a mano. Comenzamos a pasar a que los agentes escribieran código, y ahora estamos llegando al punto en que los agentes alientan a los agentes a escribir código», continuó. «Por muy grande que fue el paso del código fuente al agente, el ciclo es igualmente importante y es un gran paso».
Más adelante en la charla (alrededor del minuto 32:00 en el video de YouTube publicado arriba), Charney habló específicamente sobre los bucles que continúa ejecutando en su trabajo. Un agente busca continuamente formas de mejorar la arquitectura del código y el otro busca abstracciones redundantes que puedan integrarse. Envían solicitudes de extracción como cualquier otro codificador y el código cambia todo el tiempo, por lo que nunca deja de ejecutarse.
Es una idea poderosa, especialmente cuando tienes a alguien tan importante como Charney detrás. Con la transición a la IA de agentes, la mayoría de los usuarios se centran en gestionar a sus agentes lo mejor posible. Esto significa establecer objetivos claros, ver unidades individuales de progreso y asegurarse de que los agentes no se desvíen demasiado de la indicación. Este bucle va un paso más allá al permitir que un enjambre de agentes opere continuamente en segundo plano de forma indefinida. Es difícil confiar mucho en la IA, pero los modelos están mejorando rápidamente y podrían ser el siguiente paso para lograr que la IA se encargue del trabajo real.
Lo primero que hay que darse cuenta es que esto no es nada nuevo. Los bucles recursivos (funciones que se llaman a sí mismas para repetir una acción con una condición que detiene el bucle) son un pilar de los cursos de introducción a la informática. Estos bucles siguen una lógica no determinista. Es decir, el subagente elige cuándo detener el ciclo en lugar de una condición explícita, pero el mismo enfoque básico funciona. No hay duda de que tan pronto como los programadores comiencen a usar la IA para completar tareas, veremos alguna versión de un bucle recursivo donde la IA supervisa la IA.
A diferencia de la informática clásica, los bucles de agentes pueden ser muy sencillos. Uno de los trucos más populares es el Ralph Loop (llamado así en honor a Ralph Wiggum). Básicamente, esto suma todo el trabajo que realizó el modelo y pregunta si logró su objetivo. Esta es una forma de abordar el hecho de que los modelos de IA se pierden cuando funcionan durante mucho tiempo. Es decir, hacer rebotar el modelo hacia adelante y hacia atrás hasta que se complete la tarea.
Otra forma de pensar en los bucles es como parte de un impulso general contra una mayor complejidad computacional durante las pruebas. Como observó el investigador de OpenAI, Noam Brown, a principios de este mes, los modelos modernos pueden resolver casi cualquier problema si cuentan con suficiente potencia informática. Entonces, una forma de asegurarse de resolver un problema es seguir introduciendo computación en él hasta que se complete el problema. Esto es especialmente cierto para problemas de escalada, como mejorar una base de código. En este caso, el modelo puede seguir mejorando paso a paso hasta alcanzar un determinado umbral. O, como en el ejemplo de Cherny, puede continuar realizando mejoras incrementales siempre que tenga computación para gastar.
Si eso suena caro, debería serlo. Al igual que el Agent AI anterior, AI Loop consumirá sus tokens mucho más rápido que un simple chatbot de preguntas y respuestas. Además, dado que la clave es mantener el ciclo funcionando todo el tiempo, no hay un límite superior para la cantidad que puedes gastar. Eso está bien para Anthropic, que en última instancia se dedica al negocio de vender tokens, pero puede ser un método costoso para otros.
Aún así, dependiendo del problema que su bucle de agentes esté tratando de resolver y de la configuración adecuada que le permita monitorear el gasto de tokens, la deriva y otros problemas clásicos de la IA, los beneficios pueden superar los costos.
Si compra a través de enlaces en nuestros artículos, es posible que ganemos una pequeña comisión. Esto no afecta la independencia editorial.
Source link
