Las herramientas de codificación de IA son rápidas. Puede ser difícil notar cuánto está cambiando si no funciona en su código, pero GPT-5 y Gemini 2.5 ahora han permitido automatizar un conjunto completamente nuevo de trucos de desarrolladores.
Al mismo tiempo, otras habilidades avanzan más lentamente. Si usa AI para escribir correos electrónicos, probablemente obtenga el mismo valor que hace un año. Incluso si el modelo mejora, el producto no siempre genera beneficios. Especialmente cuando el producto es un chatbot que tiene diferentes trabajos al mismo tiempo. La IA todavía está progresando, pero no se distribuye tan uniformemente como antes.
La diferencia en el progreso es más fácil de lo que parece. Las aplicaciones de codificación se benefician de miles de millones de pruebas fácilmente medibles. Esto le permite entrenar para escribir código ejecutable. Este es el aprendizaje de refuerzo (RL), tal vez la mayor fuerza impulsora de IA en los últimos seis meses, y siempre ha sido complicado. Se puede hacer el aprendizaje humano y el aprendizaje de refuerzo, pero funciona mejor cuando hay métricas claras, lo que permite que se repitan miles de millones de veces sin detener la aportación humana.
Como la industria depende cada vez más del aprendizaje de refuerzo para mejorar sus productos, vemos una diferencia real entre las características que pueden clasificarse automáticamente y las que no pueden. Las habilidades amigables con RL, como correcciones de errores y matemáticas competitivas, son más rápidas, pero las habilidades como escribir solo producen un progreso progresivo.
En resumen, hay una brecha en el fortalecimiento y se está convirtiendo en uno de los factores más importantes de lo que los sistemas de IA pueden y no pueden hacer.
En algunos aspectos, el desarrollo de software es un gran tema para el aprendizaje de refuerzo. Incluso antes de la IA había una línea de subdiship completa dedicada a probar cómo el software se mantiene bajo presión. Esto se debe a que los desarrolladores deben asegurarse de que su código no se rompa antes de que se puedan implementar. Entonces, incluso el código más elegante debe aprobar pruebas unitarias, pruebas de integración, pruebas de seguridad y más. Los desarrolladores humanos usan estas pruebas regularmente para validar su código y, como me dijo recientemente el director senior de herramientas de desarrollo de Google, también les ayuda a validar el código generado por la IA. Más que eso, ya están sistematizados y repetibles a gran escala, lo que puede ser útil para el aprendizaje de refuerzo.
No hay una manera fácil de validar correos electrónicos bien escritos o buenas respuestas de chatbot. Estas habilidades son de naturaleza subjetiva y difíciles de medir a gran escala. Sin embargo, no todas las tareas encajan correctamente en la categoría «fácil de probar» o «difícil de probar». No hay kits de prueba listos para usar para informes financieros trimestrales o ciencias actuariales, pero se podría construir una startup contable capitalmente apropiada desde cero. Por supuesto, algunos kits de prueba funcionan mejor que otros, y algunas compañías son más inteligentes sobre cómo abordar el problema. Sin embargo, la probabilidad del proceso subyacente será un determinante de si el proceso subyacente se puede hacer en un producto funcional en lugar de solo una demostración emocionante.
Eventos de TechCrunch
San Francisco
|
27-29 de octubre de 2025
Algunos procesos han resultado ser más comprobables de lo que piensas. Si me pregunté la semana pasada, habría puesto videos generados por AI en la categoría de «difícil de probar», pero los avances inconmensurables realizados por el nuevo modelo Sora 2 de OpenAI muestran que puede no ser tan difícil como parece. En Sora 2, los objetos desaparecen de la nada. Las caras se parecen más a una persona en particular que una simple colección de características. El metraje Sora 2 respeta las leyes de la física de manera clara y sutil. Si mira detrás de las cortinas, encontrará un sistema de aprendizaje de refuerzo robusto para cada una de estas cualidades. Colectivamente, marcan la diferencia entre el fotorrealismo y las divertidas alucinaciones.
Para ser claros, esta no es una regla difícil para la inteligencia artificial. Este es el resultado del aprendizaje central de refuerzo en el desarrollo de la IA, que puede cambiar fácilmente a medida que se desarrolla el modelo. Sin embargo, mientras RL sea la herramienta principal para llevar productos de IA al mercado, la brecha de refuerzo será grande y tendrá un grave impacto tanto en las nuevas empresas como en la economía en general. Si el proceso está en el lado derecho de la brecha de mejora, el inicio probablemente tendrá éxito en la automatización. Y cualquiera que haga el trabajo puede estar buscando una nueva carrera. Por ejemplo, la cuestión de qué servicios de atención médica son RL capacitables tendrá un gran impacto en la forma de la economía en los próximos 20 años. Y si una sorpresa como Sora 2 es una indicación, es posible que no necesite esperar mucho la respuesta.
Source link
