Las empresas de IA se han convertido en empresas ávidas de datos, ya que necesitan conjuntos de datos cada vez más grandes para entrenar sus modelos. Para satisfacer esa necesidad, muchas nuevas empresas de inteligencia artificial están recopilando datos activamente, ignorando convenciones de Internet de larga data, como respetar los archivos robots.txt, que indican a los rastreadores automatizados qué partes de un sitio web están prohibidas. Esto requiere que los sitios web restrinjan el acceso a los datos y, en algunos casos, celebren acuerdos de licencia con empresas de inteligencia artificial. La empresa de fitness y carreras sociales Strava está avanzando en esta dirección al restringir su sitio web e introducir tarifas para el acceso de los desarrolladores.
Para evitar el scraping, la empresa ha reforzado la seguridad en su sitio web y ahora sólo permitirá que los usuarios autorizados vean ciertos datos. Anteriormente, los usuarios podían ver detalles como perfiles públicos y listados de gimnasios sin iniciar sesión. La compañía pone todos sus datos detrás de la autenticación para protegerla del scraping fraudulento de IA.
En el lado de la API, los desarrolladores anteriormente podían comenzar a crear aplicaciones en Strava a través de un programa de acceso gratuito por niveles. Comenzaron solicitando acceso básico y luego solicitaron acceso adicional a medida que su aplicación crecía. Actualmente, la compañía está agregando una tarifa mensual fija de $11,99 a todos los desarrolladores, pero dice que el precio puede variar según la región.
Strava dice que su comunidad de desarrolladores ha crecido de 185.000 miembros el año pasado a 241.000 miembros este año, y la compañía planea continuar apoyándolos. Como parte de esto, Strava también agregará soporte para Model Context Protocol (MCP). Este es un nuevo estándar que permite a los asistentes y aplicaciones de IA acceder a datos externos de forma estructurada, lo que le brinda control sobre exactamente qué y cómo Strava los comparte.
La compañía también planea dejar de usar algunos puntos finales API (puntos de acceso separados que permiten que aplicaciones externas recuperen ciertos datos, como detalles del club) para proteger los datos del usuario. Strava ya había endurecido sus reglas API en 2024, prohibiendo su uso para el entrenamiento de IA y restringiendo que las aplicaciones de terceros vean los datos de otros usuarios. Estos cambios provocaron una reacción violenta por parte de los desarrolladores, quienes dijeron que sus aplicaciones se verían gravemente afectadas.
Algunos desarrolladores pueden aceptar tarifas de suscripción, pero desaprobar ciertos puntos finales de API puede afectar las aplicaciones dependientes. Strava ofrece a los desarrolladores un período de gracia de 90 días antes de realizar estos cambios.
El director ejecutivo de Strava, Michael Martin, dijo en una entrevista con TechCrunch que el scraping de IA sin control podría significar el fin de la Internet pública.
«Las empresas de inteligencia artificial están eliminando incesantemente sitios web públicos porque necesitan cantidades infinitas de datos de entrenamiento, lo que ralentiza el rendimiento general del sitio», dijo Martin. En los últimos meses, hemos experimentado múltiples casos de desempeño deficiente y, en algunos casos, fallas. No solo están raspando sitios públicos, sino que también ignoran los términos de la API e intentan acceder a los datos utilizando nuestras API. »
Señaló que Strava ha rechazado ofertas de los principales laboratorios de inteligencia artificial para acuerdos de licencia de datos. Destacó a Perplexity en particular, diciendo que la startup de búsqueda de IA buscó un servicio de agregación para ocultar sus orígenes a pesar del rechazo. Esto es consistente con que Perplexity haya sido acusado de conducta similar en el pasado.
Martin también advirtió sobre la sobrecarga del servidor causada por aplicaciones mal construidas y codificadas en vibración, donde las llamadas API a menudo se configuran de manera ineficiente, creando una carga desproporcionada en el sistema Strava. Este es un patrón. El año pasado, Meta presentó un argumento similar sobre la sobrecarga del sistema cuando prohibió los chatbots de terceros en WhatsApp.
Probablemente el momento no sea una coincidencia. Strava solicitó en secreto una oferta pública inicial a principios de este año, y la medida para proteger los datos puede tener como objetivo demostrar disciplina en los datos a posibles inversores. Las comparaciones con la represión de Reddit en 2024 sobre el acceso a API fueron una de las cuestiones que Martin se apresuró a plantear. A diferencia de Reddit, que valoraba el acceso a la API según la cantidad de llamadas realizadas (fuera del alcance de muchos desarrolladores de aplicaciones), Strava apuesta a que las tarifas fijas no dañarán su ecosistema de desarrolladores.
«Queremos que nuestros usuarios sientan que son dueños de sus datos y que tengan tranquilidad sobre cómo los administramos y protegemos. Pero también queremos que nuestros desarrolladores sigan prosperando y creciendo», dijo Martin.
Si compra a través de enlaces en nuestros artículos, podemos ganar una pequeña comisión. Esto no afecta la independencia editorial.
Source link
