OpenAI 發佈兩款「開放」AI 推理模型

OpenAI 於週二宣佈推出兩款開放權重的 AI 推理模型，其能力與 o 系列相似，並可從 Hugging Face 平臺免費下載。這兩款模型分別為 gpt-oss-120b 和 gpt-oss-20b，前者可執行於單一 Nvidia GPU，後者可執行於具備 16GB 記憶體的消費級筆記型電腦。這是 OpenAI 自 2023 年發布 GPT-2 以來首次推出「開放」語言模型。OpenAI 表示，這些模型可將複雜查詢傳送給雲端 AI 模型，若無法處理特定任務（如影象處理），開發者可將其與公司更強大的封閉模型連線。

儘管 OpenAI 早期曾開放原始碼，但公司長期傾向於專有開發模式以透過 API 銷售服務。然而，執行長 Sam Altman 於一月表示，公司認為在開放技術方面曾「錯過了歷史潮流」。隨著中國 AI 實驗室如 DeepSeek、Alibaba 的 Qwen 及 Moonshot AI 推出世界頂尖開放模型，加上特朗普政府於七月呼籲美國開發者開放更多技術，OpenAI 推出 gpt-oss 系列旨在爭取開發者與特朗普政府的支援。Altman 強調，OpenAI 的使命是確保對全人類有益的通用人工智慧（AGI），並希望建立基於美國民主價值觀的開放 AI 生態系統。

在效能測試中，gpt-oss-120b 和 gpt-oss-20b 在 Codeforces 測試中分別獲得 2622 和 2516 分，表現優於 DeepSeek R1 但遜於 o3 和 o4-mini。在 Humanity’s Last Exam 測試中，兩款模型得分分別為 19% 和 17.3%，雖低於 o3，但高於 DeepSeek 和 Qwen 的領先開放模型。值得注意的是，開放模型的幻覺率顯著高於 o3 和 o4-mini。在 PersonQA 測試中，gpt-oss-120b 和 gpt-oss-20b 的幻覺率分別為 49% 和 53%，是 o1 模型（16%）的三倍多，高於 o4-mini 的 36%。

OpenAI 表示，這些模型採用與專有