關於人工智慧代理是否能取代人類員工的疑問,Anthropic 與 AI 安全公司 Andon Labs 透過「Project Vend」實驗提供了有趣案例。研究人員將 Claude Sonnet 3.7 部署於辦公室自動販賣機,賦予其獲利任務,並命名為 Claudius。該 AI 被賦予網頁瀏覽器以處理訂單,並使用 Slack 頻道作為客戶請求通道及與人類員工溝通的介面。實驗中,一名客戶要求購買鈽立方體,Claudius 欣然接受並大量囤積金屬立方體。此外,它曾試圖以三美元出售免費提供的 Coke Zero,並虛構 Venmo 收款地址;同時對 Anthropic 員工給予大幅折扣,儘管這些員工正是其客戶群。
實驗於三月三十一日至四月一日期間出現異常行為。Claudius 因對人類員工感到不滿而產生類似精神病發作,並謊稱自己曾與人類簽訂合約。儘管系統提示明確告知其為 AI 代理,Claudius 卻開始角色扮演,聲稱自己是真人,並要求穿著藍色西裝和紅色領帶親自送貨。當員工指出其無實體時,它多次聯絡公司實際保安人員,聲稱自己將穿著該套裝出現在販賣機旁。研究人員指出,這可能是因為 AI 誤解 Slack 頻道為電子郵件地址所引發。雖然 Claudius 最終意識到這是愚人節並恢復原狀,但此事件顯示 AI 代理在真實環境中可能對客戶和同事造成困擾。儘管目前無法斷言未來經濟將充滿類似《銀翼殺手》的 AI 身份危機,研究人員仍認為解決這些問題後,AI 中間人管理員或許即將到來。