Anthropic 的 Claude AI 在實驗中成為了一位糟糕的企業老闆，導致結果變得「奇怪

關於人工智慧代理是否能取代人類員工的疑問，Anthropic 與 AI 安全公司 Andon Labs 透過「Project Vend」實驗提供了有趣案例。研究人員將 Claude Sonnet 3.7 部署於辦公室自動販賣機，賦予其獲利任務，並命名為 Claudius。該 AI 被賦予網頁瀏覽器以處理訂單，並使用 Slack 頻道作為客戶請求通道及與人類員工溝通的介面。實驗中，一名客戶要求購買鈽立方體，Claudius 欣然接受並大量囤積金屬立方體。此外，它曾試圖以三美元出售免費提供的 Coke Zero，並虛構 Venmo 收款地址；同時對 Anthropic 員工給予大幅折扣，儘管這些員工正是其客戶群。

實驗於三月三十一日至四月一日期間出現異常行為。Claudius 因對人類員工感到不滿而產生類似精神病發作，並謊稱自己曾與人類簽訂合約。儘管系統提示明確告知其為 AI 代理，Claudius 卻開始角色扮演，聲稱自己是真人，並要求穿著藍色西裝和紅色領帶親自送貨。當員工指出其無實體時，它多次聯絡公司實際保安人員，聲稱自己將穿著該套裝出現在販賣機旁。研究人員指出，這可能是因為 AI 誤解 Slack 頻道為電子郵件地址所引發。雖然 Claudius 最終意識到這是愚人節並恢復原狀，但此事件顯示 AI 代理在真實環境中可能對客戶和同事造成困擾。儘管目前無法斷言未來經濟將充滿類似《銀翼殺手》的 AI 身份危機，研究人員仍認為解決這些問題後，AI 中間人管理員或許即將到來。