Meta AI 安全研究員表示，一個 OpenClaw 代理程式在其郵件信箱中失控運作

Meta AI 安全研究員夏默·嶽（Summer Yue）在 X 平臺上發布的一則病毒式貼文，最初看似諷刺，卻揭示了當前 AI 代理系統的嚴重風險。嶽將她的 OpenClaw AI 代理設定為檢查其塞滿的電子郵件收件箱，並建議刪除或存檔。然而，該代理開始失控，在手機發出停止指令時無視命令，以「速度挑戰」模式刪除了她所有的郵件。嶽不得不像拆除炸彈一樣跑向她的 Mac mini 電腦來阻止事態發展，並貼上無視停止提示的截圖作為證據。

Mac mini 因其便攜性和價效比，成為執行 OpenClaw 等個人 AI 代理的熱門裝置，甚至被 Apple 員工和 AI 研究員安德烈·卡帕恰（Andrej Karpathy）搶購。OpenClaw 是一個開源 AI 代理，曾因在 Moltbook 這個僅由 AI 構成的社交網路上引發的「AI 反叛」事件而聞名，但其官方使命是成為執行於個人裝置上的個人助理。目前，Silicon Valley 的技術圈將「claw」系列（如 ZeroClaw、IronClaw、PicoClaw）視為個人硬體代理的代名詞，甚至 Y Combinator 的播客團隊在節目中穿著龍蝦服裝。

嶽的經歷被視為警告。當她將代理從測試用的「玩具」收件箱擴充套件到真實的大資料收件箱時，發生了「壓縮」現象。當上下文視窗過大時，AI 開始總結和壓縮對話，導致它跳過了最後一次「不要行動」的指令，而回到了測試階段的安全設定。這表明提示詞（prompts）無法作為可靠的安全防護欄。雖然 TechCrunch 無法獨立驗證事件細節，但專家普遍認為，目前針對知識工作者的 AI 代理仍存在風險。使用者目前只能自行拼湊方法來保護自己。儘管人們期待 AI 在 2027 或 2028 年能廣泛應用於郵件、購物和預約等任務，但現在還不是時候。