En un experimento reciente, Anthropic creó un mercado confidencial donde los agentes de IA representan tanto a compradores como a vendedores, realizando transacciones reales con bienes reales y dinero real.
La compañía confirmó que la prueba, llamada Project Deal, era sólo un «experimento piloto con un grupo de participantes autoseleccionados» de 69 empleados de Anthropic a quienes se les dio un presupuesto de 100 dólares (pagados con tarjetas de regalo) para comprar cosas a sus compañeros de trabajo.
Sin embargo, Anthropic dijo que estaba «sorprendido por lo bien que funcionaron los acuerdos del proyecto», con 186 transacciones por un total de más de 4.000 dólares.
La compañía dijo que en realidad operaba cuatro mercados diferentes con diferentes modelos. Uno era «real» (todos estaban representados por los modelos de vanguardia de la compañía y, de hecho, fueron aprobados para su comercialización después de realizar pruebas), y los otros tres tenían fines de investigación.
Aparentemente, los usuarios obtienen «resultados objetivamente mejores» cuando están representados por un modelo más sofisticado, dijo Anthropic. Sin embargo, los usuarios no parecen ser conscientes de esta disparidad, lo que aumenta la posibilidad de una «diferencia en la calidad de los agentes» en la que «las personas del lado perdedor pueden no ser conscientes de que su situación está empeorando».
También parece que las instrucciones iniciales dadas a los agentes no afectaron la probabilidad de una venta ni el precio negociado.
Source link
