文章

所有發布的 AI 新聞與論文。

依日期: 最新優先最舊優先

OpenAI 以 GPT-5.2 回應 Google 發出的「紅色警報」備註

2025年12月11日

OpenAI 於週四推出了其最新的前沿模型 GPT-5.2，旨在應對 Google 日益加劇的競爭，並將其定位為目前最先進的模型，專為開發者和日常專業用途設計。該模型透過 API 提供三種版本：Instant 專為資訊查詢、寫作和翻譯等常規查詢最佳化速度；Thinking 擅長程式設計、分析長文件、數學和規劃等複雜結構化工作；Pro 則是頂端模型，旨在為困難問題提供最大準確度和可靠性。OpenAI 首席產品官 Fidji Simo 表示，設計 5.2 是為了釋放更多經濟價值，使其在製作試算表、建立簡報、編寫程式、感知影象、理解長上下文以及使用工具方面表現更佳。 GPT-5.2 的推出正值與 Google Gemini 3 的激烈競爭中，後者在大多數測試專案上領先 LMArena 排行榜（程式設計除外，目前仍由 Anthropic 的 Claude Opus-4.5 領先）。月初有報導指出，OpenAI 執行長 Sam Altman 發布了內部「程式碼紅」備忘錄，反映 ChatGPT 流量下降及消費者市場份額流失的擔憂，呼籲調整優先事項，暫停廣告等承諾，專注於提升 ChatGPT 體驗。儘管部分員工建議延後發布以進行更多改進，OpenAI 仍將 GPT-5.2 視為重奪領導地位的手段，同時加強企業機會。公司針對開發者和工具生態系統，目標成為構建 AI 應用程式的預設基礎。 GPT-5.2 在程式設計、數學、科學、視覺、長上下文推理和工具使用等領域設定新基準，公司聲稱這將導致更可靠的代理工作流、生產級程式碼和跨大上下文及真實世界資料運作的複雜系統。其 Thinking 模式在 SWE-Bench Pro、GPQA Diamond 及 ARC-AGI 等測試中超越 Gemini 3 和 Claude Opus 4.5。研究負責人 Aidan Clark 指出，強健的數學分數是模型能否遵循多步驟邏輯、保持數字一致性並避免累積錯誤的代理指標，這對金融建模、預測和資料分析至關重要。產品負責人 Max Schwarzer 表示，GPT-5.2 Thinking 的程式碼生成和除錯有實質改進，錯誤比前代減少 38%，並
Google 的 AI 試穿功能現可僅用自拍即可使用

2025年12月11日

Google 於週四宣佈更新其 AI 虛擬試穿功能，現在使用者僅需透過自拍即可虛擬試穿衣物，無需再上傳全身照片。過去使用者必須提供全身照才能進行試穿，如今則可利用 Nano Banana，即 Google Gemini 2.5 Flash Image 模型，生成使用者的全身數位版本。使用者可選擇常規衣碼尺寸，系統將產生多張圖片供選擇，並可將其中一張設為預設試穿照片。若需要，使用者仍可選擇使用全身照或從多樣體型的模型中挑選。此新功能今日於美國上線。Google 於七月首次推出該功能，允許使用者在搜尋、Google 購物及 Google 圖片中，透過點選商品清單或服飾結果並選擇「試穿」圖示來使用。此舉符合 Google 在虛擬 AI 試穿領域的投資，公司另有一款名為 Doppl 的專屬應用程式，利用 AI 協助視覺化不同穿搭效果。本週早些時候，Google 更新了該應用，加入可購買的發現資訊流，顯示推薦專案供使用者發現並虛擬試穿，其中幾乎所有專案皆可直連商家購買。該資訊流包含 AI 生成的真實產品影片，並根據使用者個人風格建議穿搭。儘管部分使用者可能不習慣 AI 生成的資訊流，但 Google 認為這是透過 TikTok 和 Instagram 等平臺已熟悉的格式來展示產品的有效方式。
迪士尼控告谷歌停止侵權声稱遭大規模版權侵害

2025年12月11日

迪士尼於週三向 Google 發出停止侵權信，指控該科技巨頭大規模侵犯其版權。根據 Variety 報導，迪士尼聲稱 Google 利用人工智慧模型與服務，商業化分發未經授權的圖片與影片。信中比喻 Google 為「虛擬自動販賣機」，能大規模複製、渲染並分發迪士尼珍貴的版權角色與作品。此外，信中還指出許多由 Google 人工智慧服務生成的侵權圖片上帶有 Gemini 標誌，錯誤暗示 Google 對迪士尼智慧財產權的使用已獲授權。被指控侵犯的角色包括《冰雪奇緣》、《獅子王》、《莫阿娜》、《小美人魚》及《死侍》等。Google 未確認或否認這些指控，但表示將與迪士尼「展開對話」。Google 發言人強調雙方有長期互利關係，並使用公開網路資料構建人工智慧，同時已開發如 Google-extended 及 YouTube 內容識別等創新版權控制機制。值得注意的是，就在迪士尼發出此信的同一天，它與 OpenAI 簽署了一份價值 10 億美元、期限三年的協議，將迪士尼標誌性角色引入其 Sora 人工智慧影片生成器。
Google 發布迄今最深度的 AI 研究代理 —— 恰逢 OpenAI 放棄 GPT-5.2

2025年12月11日

Google 於週四發布了基於其最新基礎模型 Gemini 3 Pro 重新構思的 Gemini Deep Research 研究代理。此新代理不僅能生成研究報告，更允許開發者透過全新的互動 API 將 Google 的 SATA 模型研究能力嵌入至自有應用程式中，賦予開發者在代理式 AI 時代更深的控制權。該工具能綜合海量資訊並處理大型上下文，目前已被客戶用於盡職調查及藥物毒性安全研究等任務，並即將整合進 Google 搜尋、Google 金融、Gemini App 及 NotebookLM 等服務中，旨在讓 AI 代理取代人類進行搜尋。 Google 強調，Deep Research 受益於 Gemini 3 Pro 作為「最事實準確」模型的地位，該模型經過訓練以在複雜任務中減少幻覺。幻覺是長期深度推理代理任務中的關鍵問題，因為自主決策次數越多，單一錯誤便可能導致整體輸出失效。為證明其進展，Google 推出了名為 DeepSearchQA 的新基準測試，用於評估代理在複雜多步驟資訊搜尋任務中的表現，並開放了該基準。此外，測試還涵蓋了獨立基準「人類最後的考試」及瀏覽器代理任務基準 BrowserComp。測試結果顯示，Google 的新代理在自身基準及人類最後的考試中表現最佳，而 OpenAI 的 ChatGPT 5 Pro 則在各項測試中緊隨其後，並在 BrowserComp 上略勝一籌。然而，這些基準測試在 Google 發布後不久即顯陳舊，因為同一天 OpenAI 推出了代號為 Garlic 的 GPT 5.2 模型，該模型在一系列典型基準測試中表現優於對手，特別是 Google。此次 Google 發布的時機特別有趣，因為世界正等待著 Garlic 的推出。

文章

OpenAI 以 GPT-5.2 回應 Google 發出的「紅色警報」備註

Google 的 AI 試穿功能現可僅用自拍即可使用

迪士尼控告谷歌停止侵權 声稱遭大規模版權侵害

Google 發布迄今最深度的 AI 研究代理 —— 恰逢 OpenAI 放棄 GPT-5.2

迪士尼控告谷歌停止侵權声稱遭大規模版權侵害