Anthropic 最近進行了一項名為 Project Deal 的實驗,建立了一個分類市場,讓 AI 代理同時扮演買方與賣方,進行真實交易並使用真實金錢。該測試僅為一項由 69 名 Anthropic 員工自選參與的試點實驗,每位員工獲配 100 美元預算(以禮券形式發放)用於從同事處購買物品。儘管規模有限,Anthropic 表示對 Project Deal 的運作效果感到驚訝,最終達成 186 筆交易,總價值超過 4000 美元。公司實際運作了四個不同的市場平臺,其中一個為「真實」環境,由公司最先進的模型代表所有參與者,且交易在實驗後確實履行;另外三個則用於研究。Anthropic 指出,當使用者由更先進的模型代表時,會獲得「客觀更佳的結果」。然而,使用者似乎未察覺到這種差異,這引發了關於「代理品質」差距的討論,即處於劣勢的一方可能未意識到自己處於較差狀態。此外,實驗初期給予代理的指令似乎並未顯著影響成交機率或議價價格。
Anthropic 創建了一個用於代理人之間貿易的測試市場
分享這篇文章: