Cerrar menú
  • Inicio
  • Identidad
  • Inventos
  • Futuro
  • Ciencia
  • Startups
  • English
What's Hot

¿Está Wall Street perdiendo la fe en la IA?

El nuevo programa del creador de ‘Breaking Bad’, ‘Pluribus’, enfatiza que fue ‘creado por humanos’, no por IA

OpenAI pide a la administración Trump que amplíe los créditos fiscales de la Ley Chip para centros de datos

Facebook X (Twitter) Instagram
  • Home
  • Contáctenos
  • DMCA
  • Política de Privacidad
  • Sobre Nosotros
  • Términos y Condiciones
  • 📢 Anúnciate con Nosotros
  • Enviar publicaciones
FySelf Noticias
  • Inicio
  • Identidad
  • Inventos
  • Futuro
  • Ciencia
  • Startups
  • English
FySelf Noticias
Home»Startups»Por qué las nuevas empresas de IA están consiguiendo los datos por sí mismas
Startups

Por qué las nuevas empresas de IA están consiguiendo los datos por sí mismas

corp@blsindustriaytecnologia.comBy corp@blsindustriaytecnologia.comoctubre 16, 2025No hay comentarios5 minutos de lectura
Share Facebook Twitter Pinterest Telegram LinkedIn Tumblr Email Copy Link
Follow Us
Google News Flipboard
Share
Facebook Twitter LinkedIn Pinterest Email Copy Link

Durante una semana este verano, Taylor y su compañera de cuarto usaron cámaras GoPro en la frente mientras pintaban, esculpían y hacían tareas del hogar. Entrenaron un modelo de visión de IA y sincronizaron cuidadosamente imágenes para que el sistema pudiera capturar la misma acción desde múltiples ángulos. Fue un trabajo difícil en muchos sentidos, pero fueron bien compensados ​​por ello. Y eso le permitió a Taylor pasar la mayor parte del día creando arte.

«Nos despertamos, hicimos nuestra rutina habitual, luego nos atamos la cámara a la cabeza y sincronizamos la hora», me dijo. «Luego preparamos el desayuno y lavamos los platos. Luego tomamos caminos separados y trabajamos en nuestro arte».

Fueron contratados para producir cinco horas de metraje sincronizado cada día, pero Taylor pronto se dio cuenta de que necesitaban dedicar siete horas al día para tener tiempo suficiente para el descanso y la recuperación física.

«Causaría dolor de cabeza», dijo. «Cuando te lo quitas, lo único que te queda es un cuadrado rojo en la frente».

Taylor, que pidió que no se usara su apellido, trabajaba como profesional independiente de datos en Turing, la empresa de inteligencia artificial que la conectó con TechCrunch. El objetivo de Turing no era enseñarle a la IA cómo hacer pinturas al óleo, sino enseñarle habilidades más abstractas en la resolución secuencial de problemas y el razonamiento visual. A diferencia de los modelos de lenguaje a gran escala, los modelos visuales de Turing se entrenan completamente en videos, la mayoría de los cuales son recopilados directamente por Turing.

Junto con artistas como Taylor, Turing contrata a chefs, trabajadores de la construcción, electricistas y casi cualquier persona que use sus manos. Sudarshan Sivaraman, director de AGI de Turing, dijo a TechCrunch que la recopilación manual es la única forma de obtener un conjunto de datos suficientemente diverso.

«Estamos haciendo esto para tantos tipos diferentes de trabajos manuales que podemos obtener diversos datos en la fase previa a la capacitación», dijo Sivaraman a TechCrunch. «Tener toda esta información permite que el modelo comprenda cómo se realiza una tarea en particular».

evento de crisis tecnológica

san francisco
|
27-29 de octubre de 2025

El trabajo de Turing sobre modelos de visión es parte de un cambio creciente en la forma en que las empresas de IA manejan los datos. Mientras que antes los conjuntos de capacitación se recopilaban libremente de la web o de anotadores mal pagados, ahora las empresas pagan mucho dinero por datos cuidadosamente seleccionados.

El poder bruto de la IA ya está establecido y las empresas están recurriendo a datos de capacitación únicos como ventaja competitiva. Y en lugar de depender de contratistas para hacer el trabajo, los contratistas suelen encargarse del trabajo ellos mismos.

Un ejemplo es Fyxer, una empresa de correo electrónico que utiliza modelos de inteligencia artificial para categorizar correos electrónicos y redactar respuestas.

Después de algunos experimentos iniciales, el fundador Richard Hollingsworth descubrió que el mejor enfoque era utilizar una serie de modelos pequeños con datos de entrenamiento enfocados. A diferencia de Turing, Fyxer se basa en modelos fundamentales de otros, pero las ideas subyacentes son las mismas.

«Nos dimos cuenta de que la calidad de los datos, no la cantidad, es lo que realmente define el rendimiento», me dijo Hollingsworth.

En términos prácticos, esto significó elecciones de personal poco convencionales. Al principio, dijo Hollingsworth, Fyxer a veces superaba a los ingenieros y gerentes en un factor de 4 a 1 en la cantidad de asistentes ejecutivos necesarios para entrenar los modelos.

«Contratamos a muchos asistentes ejecutivos con experiencia porque necesitábamos capacitarlos sobre los conceptos básicos de si debían responder o no a los correos electrónicos», dijo a TechCrunch. «Este es un problema muy orientado a las personas. Es muy difícil encontrar gente buena».

El ritmo de recopilación de datos nunca disminuyó, pero con el tiempo, Hollingsworth se apegó más a los conjuntos de datos y prefirió un conjunto más cuidadosamente seleccionado de conjuntos de datos más pequeños en el período posterior a la capacitación. Como él dice, «es la calidad de los datos, no la cantidad, lo que realmente determina el rendimiento».

Esto es especialmente cierto cuando se utilizan datos sintéticos, lo que amplía tanto la gama de posibles escenarios de entrenamiento como el impacto de los defectos en el conjunto de datos original. En cuanto a la visión, Turing estima que entre el 75% y el 80% de los datos son datos sintéticos extrapolados del vídeo original de GoPro. Sin embargo, esto hace que sea aún más importante mantener el conjunto de datos original con la mayor calidad posible.

«Si los datos previos al entrenamiento en sí no son de buena calidad, entonces cualquier cosa que se haga con los datos sintéticos no será de buena calidad», afirma Sivaraman.

Más allá de las preocupaciones por la calidad, existe una fuerte lógica competitiva detrás de mantener la recopilación de datos internamente. Para Fyxer, los esfuerzos de recopilación de datos son uno de los mejores fosos de la empresa contra la competencia. En opinión de Hollingsworth, cualquiera puede incorporar un modelo de código abierto en su producto, pero no todos pueden encontrar un anotador profesional que lo convierta en un producto viable.

«Creemos que la mejor manera de hacerlo es a través de datos», dijo a TechCrunch. «A través de la creación de modelos personalizados y capacitación de datos de alta calidad impulsada por humanos».

Corrección: una versión anterior de este artículo se refería incorrectamente a Turing por su nombre. TechCrunch lamenta este error.


Source link

#Aceleradoras #CapitalRiesgo #EcosistemaStartup #Emprendimiento #InnovaciónEmpresarial #Startups
Follow on Google News Follow on Flipboard
Share. Facebook Twitter Pinterest LinkedIn Tumblr Email Copy Link
Previous ArticleRing de Amazon se asociará con Flock, una red de cámaras con inteligencia artificial utilizada por ICE, el gobierno federal y las autoridades
Next Article La leyenda del capital de riesgo Ron Conway abandona la Fundación Salesforce tras los comentarios de la Guardia Nacional de Benioff
corp@blsindustriaytecnologia.com
  • Website

Related Posts

¿Está Wall Street perdiendo la fe en la IA?

noviembre 8, 2025

El nuevo programa del creador de ‘Breaking Bad’, ‘Pluribus’, enfatiza que fue ‘creado por humanos’, no por IA

noviembre 8, 2025

OpenAI pide a la administración Trump que amplíe los créditos fiscales de la Ley Chip para centros de datos

noviembre 8, 2025
Add A Comment
Leave A Reply Cancel Reply

el último

¿Está Wall Street perdiendo la fe en la IA?

El nuevo programa del creador de ‘Breaking Bad’, ‘Pluribus’, enfatiza que fue ‘creado por humanos’, no por IA

OpenAI pide a la administración Trump que amplíe los créditos fiscales de la Ley Chip para centros de datos

Microsoft descubre un ataque de ‘fuga de susurros’ que identifica temas de chat de IA en tráfico cifrado

Publicaciones de tendencia

Suscríbete a las noticias

Suscríbete a nuestro boletín informativo y no te pierdas nuestras últimas noticias.

Suscríbete a mi boletín informativo para recibir nuevas publicaciones y consejos. ¡Manténgase al día!

Noticias Fyself es un medio digital dedicado a brindar información actualizada, precisa y relevante sobre los temas que están moldeando el futuro: economía, tecnología, startups, invenciones, sostenibilidad y fintech.

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

Facebook X (Twitter) Instagram Pinterest YouTube
  • Home
  • Contáctenos
  • DMCA
  • Política de Privacidad
  • Sobre Nosotros
  • Términos y Condiciones
  • 📢 Anúnciate con Nosotros
  • Enviar publicaciones
© 2025 noticias.fyself. Designed by noticias.fyself.

Escribe arriba y pulsa Enter para buscar. Pulsa Esc para cancelar.