文章
所有發布的 AI 新聞與論文。
-
Google 的 SIMA 2 代理使用 Gemini 在虛擬世界中進行推理與行動
Google DeepMind 於週四發布了 SIMA 2 的研究預覽,這是其通用 AI 代理的下一代產品。SIMA 2 整合了 Gemini 大型語言模型的語言與推理能力,使其不僅能遵循指令,更能理解並與環境互動。與許多 DeepMind 專案如 AlphaFold 類似,SIMA 1 最初是透過數百小時的電子遊戲資料訓練而成,旨在像人類一樣學習玩多種 3D 遊戲,包括未受過訓練的遊戲。SIMA 1 於 2024 年 3 月亮相,能在廣泛的虛擬環境中遵循基本指令,但其完成複雜任務的成功率僅為 31%,而人類為 71%。DeepMind 研究高階科學家 Joe Marino 表示,SIMA 2 在能力上相比 SIMA 1 是巨大的進步,它是一個更通用的代理,能在以前未見過的環境中完成複雜任務,並且是一個自我改進的代理,能根據自身經驗進行自我改進,這一步邁向更通用的機器人及 AGI 系統。 SIMA 2 的效能是 SIMA 1 的兩倍,由 Gemini 2.5 flash-lite 模型驅動。AGI 指人工通用智慧,DeepMind 定義為具備廣泛智力任務能力、能學習新技能並在不同領域泛化知識的系統。DeepMind 的研究人員認為,與所謂的「具身代理」合作對於通用智慧至關重要。具身代理透過身體與物理或虛擬世界互動,觀察輸入並採取行動,類似機器人或人類;而非具身代理可能僅用於處理日曆、筆記或執行程式碼。資深研究科學家 Jane Wang 指出,SIMA 2 遠超遊戲玩法,它需要理解正在發生的事情,理解使用者的要求,並以常識方式回應,這相當困難。 SIMA 2 在《No Man's Sky》中展示了其能力,代理描述了岩石星球表面的環境,並透過識別和互動來確定下一步行動。它還使用 Gemini 進行內部推理,例如當被要求走到像熟透番茄一樣顏色的房子時,代理展示了其思考過程:熟透的番茄是紅色的,因此應該去紅色的房子,然後找到並接近它。由於由 Gemini 驅動,SIMA 2 還能根據表情符號遵循指令,例如輸入樹樵刀和樹木的符號,代理
-
Google NotebookLM 新增「深度研究」工具,支援更多檔案類型
Google 正在更新其 AI 筆記與研究助手 NotebookLM,新增「Deep Research」工具以自動化並簡化複雜的線上研究,同時支援更多檔案型別。Deep Research 能像專職研究者般,根據使用者問題制定研究計畫,自行瀏覽網頁,並在數分鐘內提供基於來源的詳細報告,使用者可直接將報告加入筆記本,同時背景執行時仍可新增其他來源。使用者可在來源面板啟動搜尋並選擇「Web」作為來源,再依需求選取「Deep Research」進行完整簡報與深入分析,或選擇「Fast Research」進行快速搜尋。此外,Google 新增支援上傳 Google 試算表、Drive 檔案連結、Google Drive 中的 PDF 以及 Microsoft Word 檔案,讓使用者能從試算表生成摘要或快速複製多個 Drive 檔案連結。這些更新預計在一週內對所有使用者開放。自 2023 年底推出以來,Google 持續為 NotebookLM 增進功能,今年初引入 Video Overviews 將多媒體轉化為視覺呈現,並建立在 Audio Overviews 功能之上,後者能根據共享檔案生成 AI 播客。今年 5 月,Google 更推出 NotebookLM 的 Android 與 iOS 應用程式,使服務不再限於桌面端。
-
創投放棄舊規則 迎接 AI 新創投資的「 funky 時代
在 2025 年 TechCrunch Disrupt 活動上,風險投資界針對 AI 創業公司的投資策略展開了深入討論。Cowboy Ventures 創辦人 Aileen Lee 指出,AI 投資需要與過往技術轉型不同的方法,因為部分公司能在單年內從零營收躍升至一億美元。儘管如此,她的研究顯示 Series A 投資者不僅追求快速營收增長,還會考量資料生成能力、競爭護城河、創辦人過往成就以及產品技術深度等變數。DVx Ventures 創辦人 Jon McNeill 則提到,即使從創立到營收達五億美元,許多公司仍難以獲得後續資金。他觀察到 Series A 投資者正將原本用於成熟公司的嚴謹標準應用於種子階段,並強調吸引和留住客戶的市場進入策略(Go-to-market)至關重要,認為許多突破性公司未必擁有最佳技術。Kindred Ventures 創辦人 Steve Jang 對此提出異議,認為 mediocre 技術搭配優異的市場策略並非成功唯一路徑,兩者皆為必要條件。McNeill 隨後澄清,其原意是指創辦人需在起步階段就建立極強的銷售與行銷策略,因為投資者在此方面的評估日益精細。此外,Roy Lee 以 Cluely 為例,說明即使產品功能僅勉強運作,若擁有龐大社群媒體聲量,也可能帶來挑戰。Aileen Lee 強調,AI 公司面臨前所未有的壓力,必須像 OpenAI 和 Anthropic 那樣以驚人的速度推出產品更新與新功能,以搶佔市場先機。儘管對成長速度和產品開發速度期望極高,但業界共識認為 AI 產業仍處於極早期階段,目前尚未出現明確的絕對贏家,即使是大型語言模型(LLM)領域也是如此,競爭對手隨時可能挑戰現有領導者地位。
-
ChatGPT在日本、紐西蘭、韓國及台灣啟動試點群組聊天功能
OpenAI 於週四推出了 ChatGPT 的群組聊天功能,目前在日本、紐西蘭、韓國及臺灣等特定地區進行測試。該功能允許使用者直接在應用程式內進行協作,適用於 Free、Plus 及 Team 使用者,並支援手機與網頁平臺。此測試旨在探索人們如何使用群組對話,被描述為建立更「共享體驗」的第一步。早期使用者將受邀提供反饋,以協助公司規劃功能擴充套件。根據 OpenAI 說明,私人對話與個人記憶保持完全私密,群組聊天為邀請制,成員可隨時退出,除群組建立者外,其他參與者亦可移除他人。十八歲以下使用者的內容將經過過濾並配備額外的家長控制措施。啟動群組聊天只需點選人物圖示並新增參與者,群組人數可從一人至二十人。每個群組擁有簡短個人資料,所有對話均整理在標註的側邊欄中。GPT-5.1 Auto 處理回應並具備搜尋、圖片生成、檔案上傳及口語輸入等功能。在群組聊天中,ChatGPT 的使用限制僅計算 AI 回應次數,人類參與者之間的訊息不計入限制。ChatGPT 已學習新的社交技巧,懂得何時介入或保持安靜,使用者可標記「ChatGPT」要求其回應,它還能使用表情符號和個人資料照片建立個性化圖片。此功能標誌著 OpenAI 從簡單 AI 助手向類似社交平臺轉變的最新一步,繼九月推出擁有 TikTok 風格資訊流、演算法推薦及直接訊息功能的獨立社交應用程式 Sora 2 之後。