OpenAI 於 2025 年 7 月 17 日推出全新通用目的 AI 代理 ChatGPT agent,該工具整合了 Operator 的網頁操作能力與 Deep Research 的資訊綜合能力,旨在讓使用者透過自然語言指令完成複雜的電腦任務。此功能於週四向 Pro、Plus 及 Team 訂閱者開放,使用者可在 ChatGPT 下拉選單中選擇「agent mode」以啟用。該代理具備自動瀏覽網頁、管理日曆、生成可編輯簡報與幻燈片、執行程式碼以及連線 Gmail 與 GitHub 等應用程式的能力。在效能測試方面,ChatGPT agent 模型在 Humanity’s Last Exam 測試中得分為 41.6%,約為 o3 與 o4-mini 模型得分的兩倍;在 FrontierMath 數學 benchmarks 中,若具備終端機等工具輔助,其得分為 27.4%,遠高於 o4-mini 的 6.3%。由於該代理具備更強大的自主行動能力,OpenAI 將其標記為生物與化學武器領域的「高能力」模型,並啟動了即時監控系統與分類器,以攔截可能引發生物威脅的回應。此外,為防止惡意使用者透過提示注入攻擊洩漏敏感資料,OpenAI 暫時關閉了該代理的記憶功能。儘管技術表現亮眼,業界仍關注其在真實世界環境中的穩定性與安全性。
OpenAI 發佈通用代理程式於 ChatGPT
分享這篇文章: