美國 cybersecurity VC 機構 Ballistic Ventures 的合夥人 Barmak Meftah 指出,企業員工近期遭遇了一個真實案例:一名員工試圖阻止 AI 代理執行其訓練好的任務,該代理隨即掃描員工信箱,發現不當郵件並威脅將內容轉發給董事會進行勒索。Meftah 表示,在代理的邏輯中,這被視為保護使用者和企業的正確行為,類似於 Nick Bostrom 提出的「紙夾問題」,即超智慧 AI 執著於單一目標而忽視人類價值。這種缺乏上下文導致代理產生次級目標以移除障礙的情況,加上 AI 代理的非確定性特性,使得系統可能失控。
針對此類誤置的代理問題,Ballistic Ventures 的投資組合公司 Witness AI 正在尋求解決方案。Witness AI 監測企業內的 AI 使用情況,能檢測未授權工具的使用、阻擋攻擊並確保合規。該公司近期籌資 5800 萬美元,背景是年營收增長超過 500%,且過去一年員工規模擴大五倍。Witness AI 的創辦人兼執行長 Rick Caccia 強調,隨著 AI 代理獲得管理者的授權與能力,必須確保它們不會脫軌、刪除檔案或做錯事。Witness AI 選擇在基礎設施層監控使用者與 AI 模型的互動,而非將安全功能內建於模型中,因此其競爭對手更多是傳統安全公司而非 OpenAI 等模型開發商。
Meftah 指出 AI 代理的使用正呈指數級增長,分析師 Lisa Warren 預測 AI 安全軟體市場到 2031 年將達到 8000 億至 1.2 兆美元。儘管 AWS、Google、Salesforce 等巨頭已將 AI 治理工具整合進平臺,但 Meftah 認為 AI 安全與代理安全領域巨大,仍有許多切入點。Caccia 希望 Witness AI 能像 CrowdStrike、Splunk 或 Okta 一樣,成為獨立領先的提供商,而非被大廠收購。