文章
所有發布的 AI 新聞與論文。
-
Google 更新Gemini應用程式以對抗ChatGPT與Claude於IO 2026
Google 於週二在年度 Google I/O 活動中宣佈,Gemini 應用程式將獲得一系列重大更新,旨在將其轉變為全功能的 AI 中心,而非獨立的聊天機器人,以與 ChatGPT 和 Claude 等應用程式競爭。新更新包括「每日簡報」功能、重新設計的介面、對新 AI 影片模型 Gemini Omni 的訪問許可權,以及新的個人 AI 代理 Gemini Spark。 「每日簡報」是一個個人化摘要功能,整合使用者的收件箱、日曆及重要任務,並按優先順序排序,提供清晰的概覽與下一步建議。該功能今日向美國 Google AI 訂閱者推出。Gemini 應用程式目前擁有超過 9 億月活躍使用者,覆蓋超過 230 個國家及 70 種語言。 介面重新設計採用了名為「神經表達主義」的新設計語言,包含流暢動畫、鮮豔色彩、新字型及觸覺反饋。Gemini 的回應不再以文字牆形式呈現,而是將關鍵資訊以粗體顯示在頂部,其他內容如圖片和時間軸則隨使用者滾動顯示。 Gemini Spark 是一個全天候個人 AI 代理,協助使用者管理數位生活。作為雲端代理,它可在手機鎖定後繼續在背景執行,允許使用者建立自定義工作流。目前該功能正在測試中,預計下週向 Google AI Ultra 訂閱者開放。 此外,新推出的 Gemini Omni 影片模型結合了 Gemini 與 Google 的生成式媒體模型,可根據提示生成基於知識的輸出,例如建立黏土動畫解釋蛋白質摺疊。使用者可上傳音訊、圖片和影片以生成一致且高品質的影片。該模型將向 Google Flow 和 YouTube Shorts 的 Google AI 訂閱者推出,標誌著 Google 在多模態內容生成領域的競爭加劇。
-
Google 在 IO 2026 發佈 Antigravity 2.0,更新桌面應用程式與 CLI 工具
在 Google IO 2026 活動上,Google 推出了其代理編碼應用 Google Antigravity 2.0 的新版本,並同步發布了更新版的桌面應用程式、命令列工具(CLI)以及用於自定義工作流的開發者套件(SDK)。該工具最初於去年推出,旨在應對 Cursor 等代理編碼軟體的競爭。新版桌面應用程式允許使用者協調多個代理並同時執行任務,還能設計自定義子代理工作流及安排自動在背景執行的任務。此外,使用者可輕鬆將專案整合至 Google AI Studio、Android 和 Firebase。這些功能主要由公司新推出的 Gemini 3.5 Flash 模型驅動,該模型據稱是與 Antigravity 共同開發而成。Google 還為 Antigravity 新增了原生語音指令支援,類似於 Gmail 和 Docs 等產品。針對程式設計師,公司推出了新的 Antigravity CLI 工具,並要求使用舊版 Gemini CLI 工具的使用者進行遷移。開發者亦可利用 Antigravity SDK 建立自定義代理,Google Cloud 客戶能連線該工具來構建專案,企業使用者還可在 AI Studio 中獲取自定義代理模板。為了方便開發者,公司新增了 Antigravity 匯出工具,允許將現有專案匯出至本地繼續工作。在消費端產品方面,Google 將 Antigravity 的編碼能力應用於搜尋服務,使用者在搜尋時可獲得即時生成的自定義介面,並能邊探索主題邊建立微型應用程式。在定價策略上,Google 推出了名為 AI Ultra 的新計畫,價格為每月 100 美元,提供比 Pro 計畫高五倍的 AI 使用限制。同時,公司將頂級 AI Ultra 計畫的價格從每月 250 美元降至 200 美元,使其提供比 Pro 計畫高二十倍的限制。此舉與其他實驗室如 Anthropic 和 OpenAI 近年來推出的分層定價系統相呼應。
-
Google 在 IO 2026 發佈 Gemini Spark,一款具備 Gmail 結合功能的 24 小時代理助理
在 Google I/O 開發者大會上,Google 宣佈推出名為 Gemini Spark 的全新代理個人助理。該產品基於 Gemini 基礎模型與 Google Antigravity 的代理框架開發,由 Alphabet 執行長 Sundar Pichai 描述為智慧數位助理的下一代演進。Spark 能利用代理 AI 技術,在極少監督的情況下執行長程任務,並執行於 Google Cloud 的專用虛擬機器上,使用者無需開啟筆記型電腦即可運作。 Spark 緊隨 Anthropic 的 Claude Cowork 與 OpenAI 的 ChatGPT 代理產品之後推出,但其獨特價值在於與 Google 產品生態的整合。它預設整合 Gmail、Google Docs 及其他 Google Workspace 產品,使用者可直接透過專屬 Gmail 信箱與 Spark 互動,並透過 Chrome 瀏覽器進行網頁操作。在 Android 平臺上,使用者可透過新的 Android Halo 系統追蹤代理進度。Google Labs 副總裁 Josh Woodward 表示,Spark 能從郵件、檔案、試算表及簡報中拉取事實並撰寫草稿,協助小企業監控收件箱並不遺漏客戶問題。 Spark 支援透過 MCP 介面整合多種服務,Google 預期未來幾個月將推出更多連線。目前該產品正在 Google 內部測試,預計下週將開放給 Google AI Ultra 訂閱者使用。
-
Google為Docs與Keep新增語音提示功能
在 Google I/O 開發者大會上,Google 宣佈將語音提示功能引入 Workspace 應用程式,包括 Docs、Keep 和 Gmail。此功能旨在協助使用者撰寫草稿、記錄筆記及搜尋郵件。在 Docs 中,使用者可透過語音建立檔案草稿,例如從 Drive 檢索履歷資料、從郵件中提取活動資訊,甚至加入幽默軼事。過去使用者需手動輸入,而語音功能允許使用長句或一次性請求多個任務,並能理解使用者在對話中改變主意並要求修改細節。Google 執行長 Sundar Pichai 表示,未來使用者將能完全透過語音建立和編輯檔案。此外,Google 還將語音功能擴充套件至 Keep,利用 AI 將語音轉錄轉化為結構化筆記或清單。雖然其他應用如 Wispr Flow、Monologue 和 Aqua 等已具備類似功能,Google 本月推出的 Rambler 也整合於 Gboard 中,但此次更新進一步強化了語音互動體驗。在 Gmail 方面,使用者可與 Gemini 對話,詢問航班資訊、Airbnb 預訂程式碼或醫生預約時間等細節。隨著 AI 技術不斷滲透產品,使用者習慣提出更複雜的多步驟查詢,語音輸入成為表達長句和複雜需求的更便捷方式。當前模型已能理解使用者在句子中途改變想法並輸出最終查詢,Google 正積極響應這一趨勢,在多款應用中增加語音功能。