Anthropic crea un mercado de prueba para el comercio de agente a agente

En un experimento reciente, Anthropic creó un mercado confidencial donde los agentes de IA representan tanto a compradores como a vendedores, realizando transacciones reales con bienes reales y dinero real.

La compañía confirmó que la prueba, llamada Project Deal, era sólo un «experimento piloto con un grupo de participantes autoseleccionados» de 69 empleados de Anthropic a quienes se les dio un presupuesto de 100 dólares (pagados con tarjetas de regalo) para comprar cosas a sus compañeros de trabajo.

Sin embargo, Anthropic dijo que estaba «sorprendido por lo bien que funcionaron los acuerdos del proyecto», con 186 transacciones por un total de más de 4.000 dólares.

La compañía dijo que en realidad operaba cuatro mercados diferentes con diferentes modelos. Uno era «real» (todos estaban representados por los modelos de vanguardia de la compañía y, de hecho, fueron aprobados para su comercialización después de realizar pruebas), y los otros tres tenían fines de investigación.

Aparentemente, los usuarios obtienen «resultados objetivamente mejores» cuando están representados por un modelo más sofisticado, dijo Anthropic. Sin embargo, los usuarios no parecen ser conscientes de esta disparidad, lo que aumenta la posibilidad de una «diferencia en la calidad de los agentes» en la que «las personas del lado perdedor pueden no ser conscientes de que su situación está empeorando».

También parece que las instrucciones iniciales dadas a los agentes no afectaron la probabilidad de una venta ni el precio negociado.

Source link

What's Hot

Claros obtiene 55 millones de dólares para expandir la tecnología global de destrucción de PFAS

Claude AI descifra el esquema de prueba post-cuántica y descubre un ataque AES de 7 rondas más rápido

El nuevo motor térmico cuántico produce trabajo y enfriamiento simultáneamente

Anthropic crea un mercado de prueba para el comercio de agente a agente

Microsoft presenta el primer modelo de ciberseguridad y un nuevo sistema de ciberseguridad para agentes

Apple presenta una demanda alegando que el fraude con criptomonedas en la App Store costó a los usuarios 1,8 millones de dólares

Antares recauda 470 millones de dólares para construir un reactor nuclear para el ejército estadounidense

Claros obtiene 55 millones de dólares para expandir la tecnología global de destrucción de PFAS

Claude AI descifra el esquema de prueba post-cuántica y descubre un ataque AES de 7 rondas más rápido

El nuevo motor térmico cuántico produce trabajo y enfriamiento simultáneamente

La botnet Tengu reinicia los dispositivos Linux comprometidos cuando los defensores cierran procesos

el último

TwinH Presenta una Tecnología Revolucionaria para Cocinas Inteligentes

¡Conoce a tu gemelo digital! La IA de vanguardia de Europa que está personalizando la medicina

TwinH: El cambio de juego de la IA para servicios legales más rápidos y accesibles

What's Hot

Anthropic crea un mercado de prueba para el comercio de agente a agente

Related Posts