分類: 代理 AI
「代理 AI」分類的 AI 新聞與論文。
-
Anthropic 推出 Claude Code 網際網路版本
安提克(Anthropic)於週一推出網頁應用程式,讓其熱門 AI 程式設計助手 Claude Code 能透過瀏覽器讓開發者建立和管理多個 AI 程式設計代理。此功能現已滾動式推出給安提克 Pro 計劃(每月 20 美元)及 Max 計劃(每月 100 美元和 200 美元)的訂閱使用者。Pro 和 Max 使用者可透過訪問 claude.ai 網站並點選「Code」標籤,或使用 Claude iOS 應用程式來存取該功能。此次發布標誌著安提克試圖將 Claude Code 從僅供終端機使用的命令列介面(CLI)工具演進為可在更多地方執行的產品。儘管微軟的 GitHub Copilot 曾主導該領域,但現在 Cursor、Google、OpenAI 和安提克都擁有高效能的 AI 程式設計工具,且許多已可在網頁上使用。Claude Code 被認為是最受歡迎的工具之一,自今年 5 月廣泛推出以來,使用者數量增長了 10 倍,目前佔公司年營收的超過 5 億美元。安提克產品經理 Cat Wu 表示,公司 AI 模型的成功是關鍵因素,但團隊也刻意在產品中加入趣味性。Wu 指出,雖然終端機將繼續作為 AI 程式設計產品的核心,但安提克會將 Claude Code 應用在更多場景中,包括網頁和移動端。安提克聲稱其 Claude Code 產品本身有 90% 是由公司 AI 模型編寫的。早期的 AI 程式設計工具類似自動補全,而像 Claude Code 這樣的代理生成工具允許開發者啟動自主執行的代理。這一轉變使數百萬軟體工程師更像是在管理 AI 程式設計助手。儘管有研究發現部分工程師在使用 AI 程式設計工具時效率反而降低,且工具在大型複雜程式碼庫中仍面臨挑戰,但安提克等公司仍在持續推進 AI 程式設計代理的發展。安提克執行長 Dario Amodei 曾預測 AI 應很快能為軟體工程師撰寫 90% 的程式碼。
-
OpenAI 發布 AgentKit 助開發者建立與發佈 AI 代理
OpenAI 執行長 Sam Altman 於週一在 Dev Day 活動中宣佈推出 AgentKit,這是一套旨在協助開發者將 AI 代理從原型階段快速推向生產環境的完整工具集。Altman 表示,AgentKit 提供了構建、部署及最佳化代理工作流所需的所有功能,並大幅降低了使用門檻。此舉標誌著 OpenAI 致力於提升開發者採用率,同時回應其他 AI 平臺在企業級自主代理工具上的競爭壓力。AgentKit 包含多個核心功能,首先是類似 Canva 的 Agent Builder,允許開發者透過直觀的視覺介面快速設計代理邏輯與步驟,該功能建立在數以萬計開發者已使用的回應 API 之上。其次為 ChatKit,提供可嵌入的聊天介面,讓開發者能將自定義品牌與工作流整合至自有應用程式中。此外,還引入了針對代理的評估工具,包含逐步追蹤評分、評估個別元件的資料集、自動化提示最佳化以及直接在 OpenAI 平臺上執行外部模型評估的能力。開發者亦可透過管理控制檯安全地將代理連線到內部工具與第三方系統。為證明其易用性,OpenAI 工程師 Christina Huang 在現場僅用不到八分鐘便構建了完整的 AI 工作流與兩個代理。目前 OpenAI 已有數家合作夥伴開始利用 AgentKit 擴充套件其代理應用,而 ChatGPT 的週活躍使用者數已突破八億。
-
Google 的 Jules 輸入開發者工具鏈參與 AI 程式碼代理競賽
Google 將其 AI 編碼助手 Jules 更深入地整合進開發者工作流中,推出了新的終端機介面與公開 API,使其能連線至終端機、CI/CD 系統及 Slack 等工具。Jules 原本僅透過網站和 GitHub 訪問,如今透過 Jules Tools 終端機介面,開發者可直接在終端機使用指令與代理互動,無需切換網頁介面或 GitHub,從而減少上下文切換。Google Labs 產品總監 Kathy Korevec 表示,Jules 專為「範圍較窄的任務」設計,執行獨立且需使用者先批准計畫,與需要更多迭代與協作的 Gemini CLI 不同。Jules 的 API 已公開,允許開發者將其整合至現有工作流或 IDE,Google 團隊正規劃特定 IDE 外掛。Jules 近期新增記憶功能以記錄使用者互動偏好,並支援堆疊佈局、圖片上傳及回應 Pull Request 評論。Google 正探索減少對 GitHub 的依賴,未來可能支援其他版本控制系統或無版本控制環境。Jules 具備自我監控機制,遇問題會暫停並詢問使用者協助,但移動端原生通知尚未支援。Jules 主要面向軟體工程師,非一般 Vibe Coding 平臺。該工具於五月公開預覽,八月退出測試版,現提供結構化定價:免費版每日最多 15 個獨立任務與三個並行任務;Google AI Pro 與 Ultra 方案分別為每月 19.99 美元與 124.99 美元,提供約五倍與二十倍的任務限制。
-
NFDG支持Composite跨瀏覽器代理工具
Composite 是一家由楊凡雲和查理·迪恩於今年早些時候創立的科技公司,旨在為專業人士提供跨瀏覽器的智慧代理解決方案。與 Perplexity 的 Comet、Opera 的 Neon 等僅限單一瀏覽器的 AI 瀏覽器不同,Composite 幫助使用者無論使用哪個瀏覽器都能高效完成日常任務。楊凡雲前 Uber 產品經理指出,市場營銷、銷售、招聘及安全工程師等角色常因繁瑣的瀏覽器工作而無法發揮專業技能,因此他希望能自動化這些工作。 Composite 已於今日宣佈完成由 NFDG 領投、Menlo Ventures 和 Anthropic 的 Anthology Fund 參與的種子輪融資,總額達 560 萬美元。該工具目前支援 Mac 和 Windows 系統,使用者只需安裝瀏覽器擴充套件即可使用。Composite 能執行原子化操作,例如協助處理 Jira 缺陷回檔、撰寫個人化郵件或根據警報建立漏洞工單。創始人表示,該工具適合希望設定工作流卻無需技術知識的專業人士,能自動識別任務並執行點選或輸入等動作,且因在使用者已登入的服務中運作,無需額外聯結器即可跨網站作業。 儘管 OpenAI、Notion 及 Highlight 等公司也在開發類似的專業代理工具,Composite 因執行任務於本地、允許管理員限制工具並定義禁止網站等特性,更適合專業環境。未來幾個月,公司將最佳化自動表面任務的機制,並開發定期任務排程功能。Menlo Ventures 合夥人 Matt Kraning 認為,Composite 直觀易用,專注於專業用例,能有效處理跨功能的大量任務,在競爭激烈的 AI 代理領域具備突出潛力。