Durante una semana este verano, Taylor y su compañera de cuarto usaron cámaras GoPro en la frente mientras pintaban, esculpían y hacían tareas del hogar. Entrenaron un modelo de visión de IA y sincronizaron cuidadosamente imágenes para que el sistema pudiera capturar la misma acción desde múltiples ángulos. Fue un trabajo difícil en muchos sentidos, pero fueron bien compensados por ello. Y eso le permitió a Taylor pasar la mayor parte del día creando arte.
«Nos despertamos, hicimos nuestra rutina habitual, luego nos atamos la cámara a la cabeza y sincronizamos la hora», me dijo. «Luego preparamos el desayuno y lavamos los platos. Luego tomamos caminos separados y trabajamos en nuestro arte».
Fueron contratados para producir cinco horas de metraje sincronizado cada día, pero Taylor pronto se dio cuenta de que necesitaban dedicar siete horas al día para tener tiempo suficiente para el descanso y la recuperación física.
«Causaría dolor de cabeza», dijo. «Cuando te lo quitas, lo único que te queda es un cuadrado rojo en la frente».
Taylor, que pidió que no se usara su apellido, trabajaba como profesional independiente de datos en Turing, la empresa de inteligencia artificial que la conectó con TechCrunch. El objetivo de Turing no era enseñarle a la IA cómo hacer pinturas al óleo, sino enseñarle habilidades más abstractas en la resolución secuencial de problemas y el razonamiento visual. A diferencia de los modelos de lenguaje a gran escala, los modelos visuales de Turing se entrenan completamente en videos, la mayoría de los cuales son recopilados directamente por Turing.
Junto con artistas como Taylor, Turing contrata a chefs, trabajadores de la construcción, electricistas y casi cualquier persona que use sus manos. Sudarshan Sivaraman, director de AGI de Turing, dijo a TechCrunch que la recopilación manual es la única forma de obtener un conjunto de datos suficientemente diverso.
«Estamos haciendo esto para tantos tipos diferentes de trabajos manuales que podemos obtener diversos datos en la fase previa a la capacitación», dijo Sivaraman a TechCrunch. «Tener toda esta información permite que el modelo comprenda cómo se realiza una tarea en particular».
evento de crisis tecnológica
san francisco
|
27-29 de octubre de 2025
El trabajo de Turing sobre modelos de visión es parte de un cambio creciente en la forma en que las empresas de IA manejan los datos. Mientras que antes los conjuntos de capacitación se recopilaban libremente de la web o de anotadores mal pagados, ahora las empresas pagan mucho dinero por datos cuidadosamente seleccionados.
El poder bruto de la IA ya está establecido y las empresas están recurriendo a datos de capacitación únicos como ventaja competitiva. Y en lugar de depender de contratistas para hacer el trabajo, los contratistas suelen encargarse del trabajo ellos mismos.
Un ejemplo es Fyxer, una empresa de correo electrónico que utiliza modelos de inteligencia artificial para categorizar correos electrónicos y redactar respuestas.
Después de algunos experimentos iniciales, el fundador Richard Hollingsworth descubrió que el mejor enfoque era utilizar una serie de modelos pequeños con datos de entrenamiento enfocados. A diferencia de Turing, Fyxer se basa en modelos fundamentales de otros, pero las ideas subyacentes son las mismas.
«Nos dimos cuenta de que la calidad de los datos, no la cantidad, es lo que realmente define el rendimiento», me dijo Hollingsworth.
En términos prácticos, esto significó elecciones de personal poco convencionales. Al principio, dijo Hollingsworth, Fyxer a veces superaba a los ingenieros y gerentes en un factor de 4 a 1 en la cantidad de asistentes ejecutivos necesarios para entrenar los modelos.
«Contratamos a muchos asistentes ejecutivos con experiencia porque necesitábamos capacitarlos sobre los conceptos básicos de si debían responder o no a los correos electrónicos», dijo a TechCrunch. «Este es un problema muy orientado a las personas. Es muy difícil encontrar gente buena».
El ritmo de recopilación de datos nunca disminuyó, pero con el tiempo, Hollingsworth se apegó más a los conjuntos de datos y prefirió un conjunto más cuidadosamente seleccionado de conjuntos de datos más pequeños en el período posterior a la capacitación. Como él dice, «es la calidad de los datos, no la cantidad, lo que realmente determina el rendimiento».
Esto es especialmente cierto cuando se utilizan datos sintéticos, lo que amplía tanto la gama de posibles escenarios de entrenamiento como el impacto de los defectos en el conjunto de datos original. En cuanto a la visión, Turing estima que entre el 75% y el 80% de los datos son datos sintéticos extrapolados del vídeo original de GoPro. Sin embargo, esto hace que sea aún más importante mantener el conjunto de datos original con la mayor calidad posible.
«Si los datos previos al entrenamiento en sí no son de buena calidad, entonces cualquier cosa que se haga con los datos sintéticos no será de buena calidad», afirma Sivaraman.
Más allá de las preocupaciones por la calidad, existe una fuerte lógica competitiva detrás de mantener la recopilación de datos internamente. Para Fyxer, los esfuerzos de recopilación de datos son uno de los mejores fosos de la empresa contra la competencia. En opinión de Hollingsworth, cualquiera puede incorporar un modelo de código abierto en su producto, pero no todos pueden encontrar un anotador profesional que lo convierta en un producto viable.
«Creemos que la mejor manera de hacerlo es a través de datos», dijo a TechCrunch. «A través de la creación de modelos personalizados y capacitación de datos de alta calidad impulsada por humanos».
Corrección: una versión anterior de este artículo se refería incorrectamente a Turing por su nombre. TechCrunch lamenta este error.
Source link
