跳至內容
AI 新聞站
返回

OpenAI 以 GPT-5.2 回應 Google 發出的「紅色警報」備註

OpenAI 於週四推出了其最新的前沿模型 GPT-5.2,旨在應對 Google 日益加劇的競爭,並將其定位為目前最先進的模型,專為開發者和日常專業用途設計。該模型透過 API 提供三種版本:Instant 專為資訊查詢、寫作和翻譯等常規查詢最佳化速度;Thinking 擅長程式設計、分析長文件、數學和規劃等複雜結構化工作;Pro 則是頂端模型,旨在為困難問題提供最大準確度和可靠性。OpenAI 首席產品官 Fidji Simo 表示,設計 5.2 是為了釋放更多經濟價值,使其在製作試算表、建立簡報、編寫程式、感知影象、理解長上下文以及使用工具方面表現更佳。

GPT-5.2 的推出正值與 Google Gemini 3 的激烈競爭中,後者在大多數測試專案上領先 LMArena 排行榜(程式設計除外,目前仍由 Anthropic 的 Claude Opus-4.5 領先)。月初有報導指出,OpenAI 執行長 Sam Altman 發布了內部「程式碼紅」備忘錄,反映 ChatGPT 流量下降及消費者市場份額流失的擔憂,呼籲調整優先事項,暫停廣告等承諾,專注於提升 ChatGPT 體驗。儘管部分員工建議延後發布以進行更多改進,OpenAI 仍將 GPT-5.2 視為重奪領導地位的手段,同時加強企業機會。公司針對開發者和工具生態系統,目標成為構建 AI 應用程式的預設基礎。

GPT-5.2 在程式設計、數學、科學、視覺、長上下文推理和工具使用等領域設定新基準,公司聲稱這將導致更可靠的代理工作流、生產級程式碼和跨大上下文及真實世界資料運作的複雜系統。其 Thinking 模式在 SWE-Bench Pro、GPQA Diamond 及 ARC-AGI 等測試中超越 Gemini 3 和 Claude Opus 4.5。研究負責人 Aidan Clark 指出,強健的數學分數是模型能否遵循多步驟邏輯、保持數字一致性並避免累積錯誤的代理指標,這對金融建模、預測和資料分析至關重要。產品負責人 Max Schwarzer 表示,GPT-5.2 Thinking 的程式碼生成和除錯有實質改進,錯誤比前代減少 38%,並


分享這篇文章:

上一篇
Google 的 AI 試穿功能現可僅用自拍即可使用
下一篇
Google發表「Disco」,一個基於Gemini的工具,可用於從瀏覽器分頁建立網頁應用程式