OpenAI 和 Google 皆超越數學選手，但彼此之間未見高下

OpenAI 與 Google DeepMind 的 AI 模型在 2025 年國際數學奧林匹克（IMO）中分別獲得金牌，這項成就由兩家公司獨立宣佈。IMO 是全球最古老且最具挑戰性的高中生數學競賽之一，此結果凸顯了 AI 系統的快速進步，也顯示 Google 與 OpenAI 在 AI 競賽中實力相當。由於許多 AI 研究人員來自數學競賽背景，這類基準測試對他們意義重大。去年 Google 使用需人類介入翻譯的「正式」系統獲得銀牌，而今年兩家公司均投入能直接處理自然語言問題並生成證明答案的「非正式」系統。兩方聲稱其模型正確回答了六題中的五題，表現優於大多數高中生及去年 Google 的 AI 模型，且無需人類協助。

OpenAI 與 Google 的研究人員表示，這些金牌成績代表 AI 推理模型在非可驗證領域的突破。儘管 AI 在簡單數學或程式設計任務上表現良好，但在解決方案模糊的任務上仍具挑戰。然而，Google 對 OpenAI 的宣佈方式提出質疑，認為其提前宣稱金牌且未經 IMO 官方評審。Google DeepMind 首席研究員 Thang Luong 表示，Google 尊重學生並等待官方評分結果才於週一公佈。OpenAI 研究員 Noam Brown 則指出，OpenAI 最初拒絕參與正式競賽，因專注於自然語言系統，且不知曉 Google 參與了非正式測試。OpenAI 聲稱僱用了三名前 IMO 金牌得主進行第三方評估，但在得知成績後依 IMO 要求延後宣佈。儘管 Google 過程更嚴謹，但此爭論可能忽略了大局：全球頂尖學生中僅少數能與 OpenAI 和 Google 的 AI 模型比肩。OpenAI 正準備推出 GPT-5，並試圖維持其行業領先的形象。