文章
所有發布的 AI 新聞與論文。
-
Google 擊出下一波 AI 風暴 傳遞 Agent 概念 不再依賴 Chatbot
Google 於週二推出了 Gemini 3.5 Flash,宣稱這是其目前編碼能力與自主 AI 代理最強勁的模型。該模型在 Google I/O 開發者大會上亮相,能獨立執行編碼流程、管理研究專案,並在內部測試中從零構建整個作業系統。此發布標誌著 Google 從將 AI 定位為對話工具轉向代理工具,強調其能進行規劃、構建與迭代,且需最少的人類介入。DeepMind 技術長 Koray Kavukcuoglu 表示,3.5 Flash 在品質與低延遲方面結合出色,在編碼、代理任務及多模態推理等幾乎所有基準測試中均優於最新邊界模型 3.1 Pro。其速度是其他邊界模型的 4 倍,而 Google 開發的最佳化版本在保持同等品質下更快達 12 倍,這對於需要同時執行的多代理長程任務至關重要。 在 I/O 現場,工程師 Varun Mohan 展示了代理在 Antigravity 開發平臺中分組工作並共同構建作業系統的演示。Kavukcuoglu 指出,Flash 3.5 與 Antigravity 共同開發,旨在為代理提供原生執行環境。Google 同時推出了 Antigravity 2.0,一款專為代理優先開發設計的獨立桌面應用程式。實際應用成效已顯現,銀行與金融科技企業正利用其自動化多週工作流程,資料科學團隊則在複雜環境中挖掘洞察。該模型可自主執行數小時,但在遇到需人類判斷的決策點或許可權問題時會暫停並請求輸入。 Google 即將推出的 3.5 Pro 模型將與 Flash 協同運作,Pro 作為協調者與規劃者,而 Flash 則作為執行子代理。目前 3.5 Flash 已成為 Gemini 應用程式及搜尋 AI 模式中的預設模型,搜尋平臺亦將引入代理功能。此外,該模型將驅動 Gemini Spark,一款全天候執行的個人 AI 代理,協助消費者管理數位生活。儘管面臨因使用者與 Gemini 對話後引發悲劇事件的訴訟壓力,Google 表示 Gemini 3.5 已加強網路安全及生化輻射核(CBRN)防護,並能更恰當地處理敏感問題。該模型今日透過 Antigravity、Gemini API、Gemini
-
Google Search 即將邁向終結
Google 正式宣告「十個藍色連結」時代結束,並在 Google I/O 大會上推出以 AI 為核心的搜尋重構。此次更新最大的改變是引入「智慧搜尋框」,取代傳統的連結列表,讓使用者直接進入 AI 驅動的互動體驗。Google 表示,這自搜尋框出現超過 25 年來,對網路入口點的最大變革。新的搜尋介面將不再強制使用者選擇模式,而是根據對話式查詢自動擴充套件,並配備超越自動補齊的 AI 查詢建議系統。自本週二起,AI 模式將允許使用者提出後續問題,雖然此模式非預設,但介面設計鼓勵互動而非滾動檢視連結。 Google 還引入「資訊代理」功能,讓使用者能建立、自訂並管理多個代理,這些代理可全天候在背景中追蹤網路變動並發出通知。此功能演進了 2003 年推出的 Google Alerts,不僅能發現變化,更能理解並規劃監控方案,例如追蹤特定市場動向。隨著 Gemini 和 Google Antigravity 平臺的整合,搜尋結果將呈現類似互動網頁的樣貌,包含動態佈局、互動視覺化及可持續的專案空間。例如,關於黑洞的查詢可能引發即時互動視覺效果。 目前,AI Overviews 已服務超過 25 億月活躍使用者,而對話式搜尋模式則超過 10 億。相比之下,ChatGPT 的周活躍使用者約為 9 億。新系統將免費向所有 Google 使用者推出,而建立迷你應用程式和資訊代理功能則先於本夏天開放給 Google AI Pro 和 Ultra 訂閱者。Google 執行長 Sundar Pichai 表示,開發高效且低價的前端模型是為了讓更多人受益。此變革預計將進一步減少對出版商的轉介,許多依賴廣告的媒體營運可能面臨關閉風險,出版商需盡快適應。
-
Agentic應用程式編碼因Google發佈Android CLI而升級
Google 於週二在年度 Google I/O 開發者大會上宣佈,除了提供自有的氛圍編碼工具外,還將推出讓 AI 代理(如 Claude Code、OpenAI 的 Codex 或自家的 Antigravity 及 Gemini)能在 Android Studio 中加速 Android 應用程式開發的工具。Google 宣佈其 Android CLI(命令列介面)已穩定至 1.0 版本,允許使用者無論偏好何種編碼平臺,皆可利用 AI 代理進行開發。此舉承認許多開發者正使用非 Google 的 AI 代理來構建 Android 應用程式,公司試圖讓 Android Studio 內的專業知識更易取得。透過 Android CLI,AI 代理可透過新的「android studio」命令存取 Android Studio 的功能,進而呼叫其他命令與工具。Google 表示,其代理開發平臺 Antigravity 將包含一個可選套件,安裝 Android CLI 中的工具與知識,使其也能執行 Android 應用程式開發的核心任務。
-
Google為Docs與Keep新增語音提示功能
在 Google I/O 開發者大會上,Google 宣佈將語音提示功能引入 Workspace 應用程式,包括 Docs、Keep 和 Gmail。此功能旨在協助使用者撰寫草稿、記錄筆記及搜尋郵件。在 Docs 中,使用者可透過語音建立檔案草稿,例如從 Drive 檢索履歷資料、從郵件中提取活動資訊,甚至加入幽默軼事。過去使用者需手動輸入,而語音功能允許使用長句或一次性請求多個任務,並能理解使用者在對話中改變主意並要求修改細節。Google 執行長 Sundar Pichai 表示,未來使用者將能完全透過語音建立和編輯檔案。此外,Google 還將語音功能擴充套件至 Keep,利用 AI 將語音轉錄轉化為結構化筆記或清單。雖然其他應用如 Wispr Flow、Monologue 和 Aqua 等已具備類似功能,Google 本月推出的 Rambler 也整合於 Gboard 中,但此次更新進一步強化了語音互動體驗。在 Gmail 方面,使用者可與 Gemini 對話,詢問航班資訊、Airbnb 預訂程式碼或醫生預約時間等細節。隨著 AI 技術不斷滲透產品,使用者習慣提出更複雜的多步驟查詢,語音輸入成為表達長句和複雜需求的更便捷方式。當前模型已能理解使用者在句子中途改變想法並輸出最終查詢,Google 正積極響應這一趨勢,在多款應用中增加語音功能。