分類: 代理 AI
「代理 AI」分類的 AI 新聞與論文。
-
Anthropic 發佈 Opus 4.8 新增「動態工作流」工具
安提洛普公司(Anthropic)於週四推出了其最新公開模型 Opus 4.8,該版本定價與前次 Opus 版本相同,且可隨時使用。此更新僅在 Opus 4.7 推出後 41 天即完成,遠快於其 Sonnet 和 Haiku 模型通常的三至七個月更新週期。此次快速迭代可能與 Opus 4.7 收到的冷遇有關,同時 OpenAI 的 Codex 與 Google 的 Gemini Flash 模型也推出了重大更新,增加了安提洛普的競爭壓力。 Opus 4.8 在標準測試指標上表現優異,特別關注其處理不良或不明確資料的能力。早期測試顯示,新模型更傾向於標記其工作結果的不確定性,並減少無根據的陳述。橋水集團(Bridgewater)的員工表示,此次升級最大的差異在於 Opus 4.8 能主動標記分析輸入與輸出的問題,這是其他模型常遺漏且需使用者自行發現的缺陷。 此外,安提洛普同時推出了名為 Dynamic Workflows 的新功能,目前處於研究預覽階段。該系統旨在協助大型模型如 Opus 管理跨數百個並行子代理的複雜任務。根據官方說明,結合 Claude Code 與 Opus 4.8,現在可以從啟動到合併完成基於數百千行程式碼的整個程式碼庫規模遷移,並沿用現有的測試套件作為標準。 儘管安提洛普仍因上月試點引發的網路安全顧慮而暫緩其最先進的 Mythos 模型發布,但公司在本次 Opus 發布中暗示,一旦完成必要的安全防護措施,Mythos 預覽期可能即將結束,並預計在幾週內將該類模型推向所有客戶。
-
華盛頓大學研究團隊開發的AI模型成功預測新型冠狀病毒變異株
美國 AI 新創公司 Sesame 於週四發布了其開發超過一年的對話式 AI 代理的公開預覽版。該公司由 Oculus 創辦人及 Meta 前 VR 團隊成員共同創立,透過新推出的 iOS 應用程式重新定義了傳統 AI 聊天機器人體驗,旨在解決快速回覆與深思熟慮回覆之間的張力。Sesame 宣稱建立了快速搜尋與檢索系統,使 AI 能進行並行搜尋並即時將結果編織進對話中,讓回應更自然且具備人類思維的轉折能力。應用程式提供四位名為 Maya、Miles、Simone 和 Charlie 的 AI 代理,各自擁有獨特的聲音、性格、觀點與記憶。Maya 與 Miles 曾在研究預覽中供超過一百萬人使用。在測試期間,公司推出了包含圖片搜尋卡片、筆記功能、文字模式及隱私模式等特性。Sesame 目前已在 39 個國家推出 iOS 版本,暫時免費使用,Android 預覽版將未來推出。該公司的長期目標是於 2027 年推出智慧眼鏡,並讓 AI 代理不僅能思考,更能代表使用者執行具體行動,取代單純的聊天機器人角色。
-
如何使用 Google 新 AI 創作助手突破常規搜尋限制
在 Google I/O 2026 年度開發者大會上,科技巨頭 Google 正式揭曉了搜尋功能的全新代理能力,允許使用者建立、自訂及管理多個 AI 代理,以持續追蹤感興趣的主題。此舉標誌著 Google 向能主動執行任務的代理式 AI 系統邁進,取代過去僅回應單一問題的傳統模式。這些資訊代理將全天候運作,整合多來源資訊、解釋重要性、比較觀點並提供可執行見解,其演進方向類似於 2003 年推出的 Google Alerts,但功能更為強大。使用者可透過搜尋頁面的 AI Mode 輸入指令,例如追蹤特定電影票價或市場動態,系統會自動傳送推送通知並記錄在 AI Mode 歷史中供後續管理。此功能預計於今年夏季推出,首階段將開放給美國 Google AI Pro 及 Ultra 訂閱使用者,隨後擴充套件至其他市場。此外,Google 還重構了搜尋介面,推出超過 25 年來最大的改版,包含重新設計的「智慧搜尋框」與更進階的 AI 驅動查詢建議系統,旨在支援更長且具語境的對話式查詢。
-
Google 擊出下一波 AI 風暴 傳遞 Agent 概念 不再依賴 Chatbot
Google 於週二推出了 Gemini 3.5 Flash,宣稱這是其目前編碼能力與自主 AI 代理最強勁的模型。該模型在 Google I/O 開發者大會上亮相,能獨立執行編碼流程、管理研究專案,並在內部測試中從零構建整個作業系統。此發布標誌著 Google 從將 AI 定位為對話工具轉向代理工具,強調其能進行規劃、構建與迭代,且需最少的人類介入。DeepMind 技術長 Koray Kavukcuoglu 表示,3.5 Flash 在品質與低延遲方面結合出色,在編碼、代理任務及多模態推理等幾乎所有基準測試中均優於最新邊界模型 3.1 Pro。其速度是其他邊界模型的 4 倍,而 Google 開發的最佳化版本在保持同等品質下更快達 12 倍,這對於需要同時執行的多代理長程任務至關重要。 在 I/O 現場,工程師 Varun Mohan 展示了代理在 Antigravity 開發平臺中分組工作並共同構建作業系統的演示。Kavukcuoglu 指出,Flash 3.5 與 Antigravity 共同開發,旨在為代理提供原生執行環境。Google 同時推出了 Antigravity 2.0,一款專為代理優先開發設計的獨立桌面應用程式。實際應用成效已顯現,銀行與金融科技企業正利用其自動化多週工作流程,資料科學團隊則在複雜環境中挖掘洞察。該模型可自主執行數小時,但在遇到需人類判斷的決策點或許可權問題時會暫停並請求輸入。 Google 即將推出的 3.5 Pro 模型將與 Flash 協同運作,Pro 作為協調者與規劃者,而 Flash 則作為執行子代理。目前 3.5 Flash 已成為 Gemini 應用程式及搜尋 AI 模式中的預設模型,搜尋平臺亦將引入代理功能。此外,該模型將驅動 Gemini Spark,一款全天候執行的個人 AI 代理,協助消費者管理數位生活。儘管面臨因使用者與 Gemini 對話後引發悲劇事件的訴訟壓力,Google 表示 Gemini 3.5 已加強網路安全及生化輻射核(CBRN)防護,並能更恰當地處理敏感問題。該模型今日透過 Antigravity、Gemini API、Gemini