文章

所有發布的 AI 新聞與論文。

依日期: 最新優先最舊優先

Google 的 SIMA 2 代理使用 Gemini 在虛擬世界中進行推理與行動

2025年11月13日

Google DeepMind 於週四發布了 SIMA 2 的研究預覽，這是其通用 AI 代理的下一代產品。SIMA 2 整合了 Gemini 大型語言模型的語言與推理能力，使其不僅能遵循指令，更能理解並與環境互動。與許多 DeepMind 專案如 AlphaFold 類似，SIMA 1 最初是透過數百小時的電子遊戲資料訓練而成，旨在像人類一樣學習玩多種 3D 遊戲，包括未受過訓練的遊戲。SIMA 1 於 2024 年 3 月亮相，能在廣泛的虛擬環境中遵循基本指令，但其完成複雜任務的成功率僅為 31%，而人類為 71%。DeepMind 研究高階科學家 Joe Marino 表示，SIMA 2 在能力上相比 SIMA 1 是巨大的進步，它是一個更通用的代理，能在以前未見過的環境中完成複雜任務，並且是一個自我改進的代理，能根據自身經驗進行自我改進，這一步邁向更通用的機器人及 AGI 系統。 SIMA 2 的效能是 SIMA 1 的兩倍，由 Gemini 2.5 flash-lite 模型驅動。AGI 指人工通用智慧，DeepMind 定義為具備廣泛智力任務能力、能學習新技能並在不同領域泛化知識的系統。DeepMind 的研究人員認為，與所謂的「具身代理」合作對於通用智慧至關重要。具身代理透過身體與物理或虛擬世界互動，觀察輸入並採取行動，類似機器人或人類；而非具身代理可能僅用於處理日曆、筆記或執行程式碼。資深研究科學家 Jane Wang 指出，SIMA 2 遠超遊戲玩法，它需要理解正在發生的事情，理解使用者的要求，並以常識方式回應，這相當困難。 SIMA 2 在《No Man's Sky》中展示了其能力，代理描述了岩石星球表面的環境，並透過識別和互動來確定下一步行動。它還使用 Gemini 進行內部推理，例如當被要求走到像熟透番茄一樣顏色的房子時，代理展示了其思考過程：熟透的番茄是紅色的，因此應該去紅色的房子，然後找到並接近它。由於由 Gemini 驅動，SIMA 2 還能根據表情符號遵循指令，例如輸入樹樵刀和樹木的符號，代理
Google NotebookLM 新增「深度研究」工具，支援更多檔案類型

2025年11月13日

Google 正在更新其 AI 筆記與研究助手 NotebookLM，新增「Deep Research」工具以自動化並簡化複雜的線上研究，同時支援更多檔案型別。Deep Research 能像專職研究者般，根據使用者問題制定研究計畫，自行瀏覽網頁，並在數分鐘內提供基於來源的詳細報告，使用者可直接將報告加入筆記本，同時背景執行時仍可新增其他來源。使用者可在來源面板啟動搜尋並選擇「Web」作為來源，再依需求選取「Deep Research」進行完整簡報與深入分析，或選擇「Fast Research」進行快速搜尋。此外，Google 新增支援上傳 Google 試算表、Drive 檔案連結、Google Drive 中的 PDF 以及 Microsoft Word 檔案，讓使用者能從試算表生成摘要或快速複製多個 Drive 檔案連結。這些更新預計在一週內對所有使用者開放。自 2023 年底推出以來，Google 持續為 NotebookLM 增進功能，今年初引入 Video Overviews 將多媒體轉化為視覺呈現，並建立在 Audio Overviews 功能之上，後者能根據共享檔案生成 AI 播客。今年 5 月，Google 更推出 NotebookLM 的 Android 與 iOS 應用程式，使服務不再限於桌面端。
創投放棄舊規則迎接 AI 新創投資的「 funky 時代

2025年11月13日

在 2025 年 TechCrunch Disrupt 活動上，風險投資界針對 AI 創業公司的投資策略展開了深入討論。Cowboy Ventures 創辦人 Aileen Lee 指出，AI 投資需要與過往技術轉型不同的方法，因為部分公司能在單年內從零營收躍升至一億美元。儘管如此，她的研究顯示 Series A 投資者不僅追求快速營收增長，還會考量資料生成能力、競爭護城河、創辦人過往成就以及產品技術深度等變數。DVx Ventures 創辦人 Jon McNeill 則提到，即使從創立到營收達五億美元，許多公司仍難以獲得後續資金。他觀察到 Series A 投資者正將原本用於成熟公司的嚴謹標準應用於種子階段，並強調吸引和留住客戶的市場進入策略（Go-to-market）至關重要，認為許多突破性公司未必擁有最佳技術。Kindred Ventures 創辦人 Steve Jang 對此提出異議，認為 mediocre 技術搭配優異的市場策略並非成功唯一路徑，兩者皆為必要條件。McNeill 隨後澄清，其原意是指創辦人需在起步階段就建立極強的銷售與行銷策略，因為投資者在此方面的評估日益精細。此外，Roy Lee 以 Cluely 為例，說明即使產品功能僅勉強運作，若擁有龐大社群媒體聲量，也可能帶來挑戰。Aileen Lee 強調，AI 公司面臨前所未有的壓力，必須像 OpenAI 和 Anthropic 那樣以驚人的速度推出產品更新與新功能，以搶佔市場先機。儘管對成長速度和產品開發速度期望極高，但業界共識認為 AI 產業仍處於極早期階段，目前尚未出現明確的絕對贏家，即使是大型語言模型（LLM）領域也是如此，競爭對手隨時可能挑戰現有領導者地位。
ChatGPT在日本、紐西蘭、韓國及台灣啟動試點群組聊天功能

2025年11月14日

OpenAI 於週四推出了 ChatGPT 的群組聊天功能，目前在日本、紐西蘭、韓國及臺灣等特定地區進行測試。該功能允許使用者直接在應用程式內進行協作，適用於 Free、Plus 及 Team 使用者，並支援手機與網頁平臺。此測試旨在探索人們如何使用群組對話，被描述為建立更「共享體驗」的第一步。早期使用者將受邀提供反饋，以協助公司規劃功能擴充套件。根據 OpenAI 說明，私人對話與個人記憶保持完全私密，群組聊天為邀請制，成員可隨時退出，除群組建立者外，其他參與者亦可移除他人。十八歲以下使用者的內容將經過過濾並配備額外的家長控制措施。啟動群組聊天只需點選人物圖示並新增參與者，群組人數可從一人至二十人。每個群組擁有簡短個人資料，所有對話均整理在標註的側邊欄中。GPT-5.1 Auto 處理回應並具備搜尋、圖片生成、檔案上傳及口語輸入等功能。在群組聊天中，ChatGPT 的使用限制僅計算 AI 回應次數，人類參與者之間的訊息不計入限制。ChatGPT 已學習新的社交技巧，懂得何時介入或保持安靜，使用者可標記「ChatGPT」要求其回應，它還能使用表情符號和個人資料照片建立個性化圖片。此功能標誌著 OpenAI 從簡單 AI 助手向類似社交平臺轉變的最新一步，繼九月推出擁有 TikTok 風格資訊流、演算法推薦及直接訊息功能的獨立社交應用程式 Sora 2 之後。

文章

Google 的 SIMA 2 代理使用 Gemini 在虛擬世界中進行推理與行動

Google NotebookLM 新增「深度研究」工具，支援更多檔案類型

創投放棄舊規則 迎接 AI 新創投資的「 funky 時代

ChatGPT在日本、紐西蘭、韓國及台灣啟動試點群組聊天功能

創投放棄舊規則迎接 AI 新創投資的「 funky 時代