Anthropic 賜予 Claude 更多控制權，但仍加以限制

Anthropic 推出最新更新，旨在讓其 Claude 模型在「自動模式」下自行決定哪些行動是安全的，無需人類即時批准。此功能目前處於研究預覽階段，僅供測試，尚未正式上線。該模式利用 AI 防護機制審查每個行動，檢查是否存在使用者未請求的風險行為或提示注入攻擊跡象。安全行動將自動執行，而風險行動則會被阻擋。這是在 Claude Code 現有「危險跳過許可權」命令基礎上增加的安全層，將原本由使用者掌握的決策權轉移給 AI。此舉反映了行業趨勢，即 AI 工具越來越被設計為無需等待人類授權即可執行任務。雖然 GitHub 和 OpenAI 等公司已有自主編碼工具，但 Anthropic 的創新在於將請求許可權的時機決定權交給 AI。目前該功能僅支援 Claude Sonnet 4.6 和 Opus 4.6 模型，並將逐步向企業使用者和 API 使用者開放。公司建議在隔離環境中測試，以限制潛在損壞。由於 Anthropic 尚未詳細說明安全層區分安全與風險行動的具體標準，開發者需進一步瞭解細節。此功能緊接在 Claude Code Review 和 Dispatch for Cowork 之後推出，旨在平衡速度與控制，解決過度防護導致效率低下或防護不足導致系統不可預測的挑戰。