分類: 代理 AI
「代理 AI」分類的 AI 新聞與論文。
-
Slackbot 現已成為一個 AI 副本
Salesforce 旗下的企業通訊平臺 Slack 內建的自動化助手 Slackbot 正式邁入新時代,轉型為具備自主行動能力的 AI 代理。Salesforce 技術長 Parker Harris 希望此版本能像 OpenAI 的 ChatGPT 一樣引發病毒式傳播。該新版本於週二推出,一般適用於 Business+ 和 Enterprise+ 客戶,可在 Slack 平臺內尋找資訊、草擬郵件及安排會議。若獲得許可,Slackbot 還能連線到 Microsoft Teams 和 Google Drive 等其他企業產品以獲取資訊,讓使用者無需離開 Slack 即可跨多個應用工作。 Salesforce 正投入資源開發 AI 產品以維持並擴大市場份額。此次重構的 Slackbot 最初於十月在 Salesforce 年度 Dreamforce 會議上宣佈,是該公司企業級 AI 產品計劃的一部分。Harris 表示,下一代 Slackbot 與以往版本完全不同,公司保留原名是因為其知名度已高。Slack 通常透過更新功能來推動採用率,而 Slackbot 則被定位為由生成式 AI 驅動的「員工代理」,經過高度客製化設計。Salesforce 會先讓內部員工測試數個月,Harris 幽默地表示他們喜歡先喝自己的香檳,且 Slackbot 是目前採用率最高的內部工具。 Harris 指出,內部使用者的活躍數量顯示產品已達到市場契合度,採用是基於自願而非強制。未來,Slackbot 將不僅限於文字代理,還將增加語音功能並具備瀏覽網際網路的能力。Harris 對投資 Slackbot 的前景充滿信心,認為這不僅對 Slack 有益,對整個公司也極為重要。
-
Anthropic 新推 Cowork 工具提供 Claude 編碼功能無需寫碼
安提克(Anthropic)於週一宣佈推出名為 Cowork 的新工具,這被設計為更易用的 Claude Code 版本。該工具內建於 Claude Desktop 應用程式中,允許使用者指定特定資料夾供 Claude 讀取或修改檔案,並透過標準聊天介面提供進一步指示。Cowork 的效果類似於封閉式的 Claude Code 例項,但設定所需的技術門檻遠低於前者。目前該工具處於研究預覽階段,僅對 Max 訂閱者開放,其他計劃的使用者可加入候選名單。 Cowork 的靈感部分來自於越來越多訂閱者將 Claude Code 用於非程式碼任務,將其視為通用代理式 AI 工具。該工具建立在 Claude Agent SDK 之上,因此使用與 Claude Code 相同的底層模型。資料夾分割槽功能提供了管理 Cowork 存取檔案的簡易方式。由於應用程式不需要命令列工具或虛擬環境,這對非技術使用者來說更具吸引力,從而開啟了新的潛在用途。安提克舉例說明,Cowork 可用於將一組收據照片組裝成費用報告,但使用者也曾用它來管理媒體檔案、掃描社交媒體貼文或分析對話。 與 Claude Code 類似,Cowork 設計為無需使用者輸入即可執行一系列動作,這在工具被給予模糊或矛盾的指示時可能構成危險。在宣佈新工具的部落格文章中,安提克明確警告了提示注入或檔案刪除的風險,建議使用者將指示盡可能清晰且無歧義。文章指出這些風險在 Cowork 中並非新事物,但可能是首次使用超越簡單對話的進階工具。Claude Code 自 2024 年 11 月以命令列工具形式推出後,已成為安提克最成功的產品之一,促使公司在近期推出了一系列新介面,包括十月推出的網頁介面以及隨後兩個月推出的 Slack 整合功能。
-
Google 公佈新協議促進使用 AI 代理進行商業交易
Google 於週日在國家零售聯盟(NRF)會議上宣佈推出名為通用商業協議(UCP)的新開放標準,旨在規範基於 AI 代理的購物流程。該標準由 Shopify、Etsy、Wayfair、Target 及 Walmart 等企業共同開發,允許 AI 代理跨越客戶購買流程的不同環節運作,包括產品發現與購買後支援,無需連線多個不同代理。Google 表示,該標準還與 Agent Payments Protocol (AP2)、Agent2Agent (A2A) 及 Model Context Protocol (MCP) 等其他代理協議協作。 Google 指出,Agents 與企業可根據需求選擇協議的特定擴充套件功能。未來,UCP 將應用於符合資格的 Google 產品列表,在搜尋與 Gemini 應用程式中啟用 AI 模式,讓美國零售商使用者能直接在搜尋產品時完成結帳。使用者可使用 Google Pay 付款並呼叫 Google Wallet 中的配送資訊,Google 亦將支援 PayPal 作為支付方式。Shopify 執行長 Tobi Lütke 表示,AI 代理能精準找到符合特定興趣的產品,這種偶然的發現正是商業的最佳狀態。 此外,Google 宣佈允許品牌在使用者使用 AI 模式搜尋產品時提供特別折扣。例如,當使用者搜尋現代風格地毯時,品牌可設定活動即時給予優惠。Google 還為 Merchant Center 新增資料屬性,協助賣家讓商品在 AI 搜尋中更顯眼。PayPal 與 OpenAI 也在推動賣家在 AI 聊天機器人結果中更具可見性,Startup Prompting Company 則協助產品出現在 AI 回答中。Google 允許商家整合品牌化 AI 商務代理於搜尋結果中回答客戶問題,Lowe's、Michaels、Poshmark 及 Reebok 等已採用此功能。競爭對手 Shopify 與 Meta 也在探索 AI 工具。Google 同時推出 Gemini Enterprise for Customer Experience (CX),協助零售商與餐廳處理購物與客服。Adobe 報告指出,假日期間由生成式 AI 導向賣家網站的流量增長 693.4%。
-
Google 發布迄今最深度的 AI 研究代理 —— 恰逢 OpenAI 放棄 GPT-5.2
Google 於週四發布了基於其最新基礎模型 Gemini 3 Pro 重新構思的 Gemini Deep Research 研究代理。此新代理不僅能生成研究報告,更允許開發者透過全新的互動 API 將 Google 的 SATA 模型研究能力嵌入至自有應用程式中,賦予開發者在代理式 AI 時代更深的控制權。該工具能綜合海量資訊並處理大型上下文,目前已被客戶用於盡職調查及藥物毒性安全研究等任務,並即將整合進 Google 搜尋、Google 金融、Gemini App 及 NotebookLM 等服務中,旨在讓 AI 代理取代人類進行搜尋。 Google 強調,Deep Research 受益於 Gemini 3 Pro 作為「最事實準確」模型的地位,該模型經過訓練以在複雜任務中減少幻覺。幻覺是長期深度推理代理任務中的關鍵問題,因為自主決策次數越多,單一錯誤便可能導致整體輸出失效。為證明其進展,Google 推出了名為 DeepSearchQA 的新基準測試,用於評估代理在複雜多步驟資訊搜尋任務中的表現,並開放了該基準。此外,測試還涵蓋了獨立基準「人類最後的考試」及瀏覽器代理任務基準 BrowserComp。測試結果顯示,Google 的新代理在自身基準及人類最後的考試中表現最佳,而 OpenAI 的 ChatGPT 5 Pro 則在各項測試中緊隨其後,並在 BrowserComp 上略勝一籌。然而,這些基準測試在 Google 發布後不久即顯陳舊,因為同一天 OpenAI 推出了代號為 Garlic 的 GPT 5.2 模型,該模型在一系列典型基準測試中表現優於對手,特別是 Google。此次 Google 發布的時機特別有趣,因為世界正等待著 Garlic 的推出。