軟體工程師、前量化研究員兼創業家 Neel Somani 在週末測試 OpenAI 新模型時,意外發現其數學能力有顯著突破。他將一道數學問題輸入 ChatGPT,讓其思考十五分鐘後,模型不僅產出完整解答,還被工具 Harmonic 驗證透過。該模型能引用如 Legendre 公式、Bertrand 公設及 Star of David 定理等數學公理,甚至追溯到 2013 年 Harvard 數學家 Noam Elkies 在 Math Overflow 上發表的優雅解法。儘管 ChatGPT 的最終證明與 Elkies 的工作有重要差異,但它對傳奇數學家 Paul Erdős 提出的問題版本提供了更完整的解答。
自 GPT 5.2 發布以來,該模型被形容為在數學推理上比先前版本更出色。Erdős 提出的超過一千個猜測成為 AI 數學研究的熱門目標。自聖誕節以來,Erdős 網站上有十五個問題從「未解」變為「已解」,其中十一個明確歸功於 AI 模型。數學家 Terence Tao 在其 GitHub 頁面上指出,有八個問題顯示 AI 模型在 Erdős 問題上取得了有意義的自主進展,另有六個案例是透過定位並建立在先前研究基礎上。Tao 認為,AI 系統的規模化特性使其更適合系統性地應用於 Erdős 問題中那些較少見但解法簡單的「長尾」問題。
此外,數學證明形式化(Formalization)的趨勢也推動了這一進展。雖然形式化不依賴 AI,但自動化工具如 Microsoft Research 於 2013 年開發的開源證明助手 Lean 已廣泛使用。Harmonic 的 Aristotle 工具則承諾自動化形式化工作的大部分。Harmonic 創辦人 Tudor Achim 表示,比起已解決問題數量的激增,他更關注世界頂尖數學家開始認真使用這些工具,這才是證明 AI 在數學領域發揮重要作用的關鍵證據。