跳至內容
AI 新聞站
返回

OpenAI 和 Google 皆超越數學選手,但彼此之間未見高下

OpenAI 與 Google DeepMind 的 AI 模型在 2025 年國際數學奧林匹克(IMO)中分別獲得金牌,這項成就由兩家公司獨立宣佈。IMO 是全球最古老且最具挑戰性的高中生數學競賽之一,此結果凸顯了 AI 系統的快速進步,也顯示 Google 與 OpenAI 在 AI 競賽中實力相當。由於許多 AI 研究人員來自數學競賽背景,這類基準測試對他們意義重大。去年 Google 使用需人類介入翻譯的「正式」系統獲得銀牌,而今年兩家公司均投入能直接處理自然語言問題並生成證明答案的「非正式」系統。兩方聲稱其模型正確回答了六題中的五題,表現優於大多數高中生及去年 Google 的 AI 模型,且無需人類協助。

OpenAI 與 Google 的研究人員表示,這些金牌成績代表 AI 推理模型在非可驗證領域的突破。儘管 AI 在簡單數學或程式設計任務上表現良好,但在解決方案模糊的任務上仍具挑戰。然而,Google 對 OpenAI 的宣佈方式提出質疑,認為其提前宣稱金牌且未經 IMO 官方評審。Google DeepMind 首席研究員 Thang Luong 表示,Google 尊重學生並等待官方評分結果才於週一公佈。OpenAI 研究員 Noam Brown 則指出,OpenAI 最初拒絕參與正式競賽,因專注於自然語言系統,且不知曉 Google 參與了非正式測試。OpenAI 聲稱僱用了三名前 IMO 金牌得主進行第三方評估,但在得知成績後依 IMO 要求延後宣佈。儘管 Google 過程更嚴謹,但此爭論可能忽略了大局:全球頂尖學生中僅少數能與 OpenAI 和 Google 的 AI 模型比肩。OpenAI 正準備推出 GPT-5,並試圖維持其行業領先的形象。


分享這篇文章:

上一篇
FuriosaAI 與 Meta 签約成為主要客戶
下一篇
使用者每日傳送25億條ChatGPT提示