Google 於週二推出了 Gemini 3.5 Flash,宣稱這是其目前編碼能力與自主 AI 代理最強勁的模型。該模型在 Google I/O 開發者大會上亮相,能獨立執行編碼流程、管理研究專案,並在內部測試中從零構建整個作業系統。此發布標誌著 Google 從將 AI 定位為對話工具轉向代理工具,強調其能進行規劃、構建與迭代,且需最少的人類介入。DeepMind 技術長 Koray Kavukcuoglu 表示,3.5 Flash 在品質與低延遲方面結合出色,在編碼、代理任務及多模態推理等幾乎所有基準測試中均優於最新邊界模型 3.1 Pro。其速度是其他邊界模型的 4 倍,而 Google 開發的最佳化版本在保持同等品質下更快達 12 倍,這對於需要同時執行的多代理長程任務至關重要。
在 I/O 現場,工程師 Varun Mohan 展示了代理在 Antigravity 開發平臺中分組工作並共同構建作業系統的演示。Kavukcuoglu 指出,Flash 3.5 與 Antigravity 共同開發,旨在為代理提供原生執行環境。Google 同時推出了 Antigravity 2.0,一款專為代理優先開發設計的獨立桌面應用程式。實際應用成效已顯現,銀行與金融科技企業正利用其自動化多週工作流程,資料科學團隊則在複雜環境中挖掘洞察。該模型可自主執行數小時,但在遇到需人類判斷的決策點或許可權問題時會暫停並請求輸入。
Google 即將推出的 3.5 Pro 模型將與 Flash 協同運作,Pro 作為協調者與規劃者,而 Flash 則作為執行子代理。目前 3.5 Flash 已成為 Gemini 應用程式及搜尋 AI 模式中的預設模型,搜尋平臺亦將引入代理功能。此外,該模型將驅動 Gemini Spark,一款全天候執行的個人 AI 代理,協助消費者管理數位生活。儘管面臨因使用者與 Gemini 對話後引發悲劇事件的訴訟壓力,Google 表示 Gemini 3.5 已加強網路安全及生化輻射核(CBRN)防護,並能更恰當地處理敏感問題。該模型今日透過 Antigravity、Gemini API、Gemini