Anthropic 創建了一個用於代理人之間貿易的測試市場

Anthropic 最近進行了一項名為 Project Deal 的實驗，建立了一個分類市場，讓 AI 代理同時扮演買方與賣方，進行真實交易並使用真實金錢。該測試僅為一項由 69 名 Anthropic 員工自選參與的試點實驗，每位員工獲配 100 美元預算（以禮券形式發放）用於從同事處購買物品。儘管規模有限，Anthropic 表示對 Project Deal 的運作效果感到驚訝，最終達成 186 筆交易，總價值超過 4000 美元。公司實際運作了四個不同的市場平臺，其中一個為「真實」環境，由公司最先進的模型代表所有參與者，且交易在實驗後確實履行；另外三個則用於研究。Anthropic 指出，當使用者由更先進的模型代表時，會獲得「客觀更佳的結果」。然而，使用者似乎未察覺到這種差異，這引發了關於「代理品質」差距的討論，即處於劣勢的一方可能未意識到自己處於較差狀態。此外，實驗初期給予代理的指令似乎並未顯著影響成交機率或議價價格。