跳至內容
AI 新聞站
返回

OpenAI 發佈兩款「開放」AI 推理模型

OpenAI 於週二宣佈推出兩款開放權重的 AI 推理模型,其能力與 o 系列相似,並可從 Hugging Face 平臺免費下載。這兩款模型分別為 gpt-oss-120b 和 gpt-oss-20b,前者可執行於單一 Nvidia GPU,後者可執行於具備 16GB 記憶體的消費級筆記型電腦。這是 OpenAI 自 2023 年發布 GPT-2 以來首次推出「開放」語言模型。OpenAI 表示,這些模型可將複雜查詢傳送給雲端 AI 模型,若無法處理特定任務(如影象處理),開發者可將其與公司更強大的封閉模型連線。

儘管 OpenAI 早期曾開放原始碼,但公司長期傾向於專有開發模式以透過 API 銷售服務。然而,執行長 Sam Altman 於一月表示,公司認為在開放技術方面曾「錯過了歷史潮流」。隨著中國 AI 實驗室如 DeepSeek、Alibaba 的 Qwen 及 Moonshot AI 推出世界頂尖開放模型,加上特朗普政府於七月呼籲美國開發者開放更多技術,OpenAI 推出 gpt-oss 系列旨在爭取開發者與特朗普政府的支援。Altman 強調,OpenAI 的使命是確保對全人類有益的通用人工智慧(AGI),並希望建立基於美國民主價值觀的開放 AI 生態系統。

在效能測試中,gpt-oss-120b 和 gpt-oss-20b 在 Codeforces 測試中分別獲得 2622 和 2516 分,表現優於 DeepSeek R1 但遜於 o3 和 o4-mini。在 Humanity’s Last Exam 測試中,兩款模型得分分別為 19% 和 17.3%,雖低於 o3,但高於 DeepSeek 和 Qwen 的領先開放模型。值得注意的是,開放模型的幻覺率顯著高於 o3 和 o4-mini。在 PersonQA 測試中,gpt-oss-120b 和 gpt-oss-20b 的幻覺率分別為 49% 和 53%,是 o1 模型(16%)的三倍多,高於 o4-mini 的 36%。

OpenAI 表示,這些模型採用與專有


分享這篇文章:

上一篇
OpenAI 模型首次於 AWS 上架
下一篇
部分人仍在為Perplexity辯護,儘管Cloudflare已公開點名譴責它