跳至內容
AI 新聞站
返回

Anthropic 賜予 Claude 更多控制權,但仍加以限制

Anthropic 推出最新更新,旨在讓其 Claude 模型在「自動模式」下自行決定哪些行動是安全的,無需人類即時批准。此功能目前處於研究預覽階段,僅供測試,尚未正式上線。該模式利用 AI 防護機制審查每個行動,檢查是否存在使用者未請求的風險行為或提示注入攻擊跡象。安全行動將自動執行,而風險行動則會被阻擋。這是在 Claude Code 現有「危險跳過許可權」命令基礎上增加的安全層,將原本由使用者掌握的決策權轉移給 AI。此舉反映了行業趨勢,即 AI 工具越來越被設計為無需等待人類授權即可執行任務。雖然 GitHub 和 OpenAI 等公司已有自主編碼工具,但 Anthropic 的創新在於將請求許可權的時機決定權交給 AI。目前該功能僅支援 Claude Sonnet 4.6 和 Opus 4.6 模型,並將逐步向企業使用者和 API 使用者開放。公司建議在隔離環境中測試,以限制潛在損壞。由於 Anthropic 尚未詳細說明安全層區分安全與風險行動的具體標準,開發者需進一步瞭解細節。此功能緊接在 Claude Code Review 和 Dispatch for Cowork 之後推出,旨在平衡速度與控制,解決過度防護導致效率低下或防護不足導致系統不可預測的挑戰。


分享這篇文章:

上一篇
肯塔基州婦女拒絕2600萬美元買斷農場改建為數據中心的提案
下一篇
Spotify測試新工具防止AI生成內容被歸屬真實藝人