Harmonic 是一家由 Robinhood 執行長 Vlad Tenev 共同創立的 AI 新創公司,於本週一宣佈推出 iOS 和 Android 平臺的聊天機器人應用程式,讓使用者能使用其 AI 模型 Aristotle。Harmonic 宣稱 Aristotle 能提供涉及數學推理問題的「無幻覺」答案,這在當前 AI 模型可靠性問題的背景下是一個大膽的宣稱。該公司專注於創造「數學超級智慧」或 MSI,最終希望協助依賴數學的所有領域,包括物理、統計學和電腦科學。Harmonic 執行長兼共同創辦人 Tudor Achim 表示,Aristotle 是首款能進行推理並正式驗證輸出結果的產品,在支援的定量推理領域中,他們保證沒有幻覺。
Harmonic 計劃未來推出 API 讓企業存取 Aristotle,並為消費者提供網頁應用程式。據稱,Aristotle 在 2025 年國際數學奧林匹克(IMO)的正式測試中獲得金牌,該測試將題目翻譯成機器可讀格式。Google 和 OpenAI 開發的 AI 模型雖在今年 IMO 中也獲得金牌,但這是透過非正式的自然語言測試取得的。Harmonic 目前尚未發布其他基準測試。Aristotle 的測試版推出僅在 Harmonic 於 Kleiner Perkins 領銜的 B 輪融資中籌得 1 億美元後幾週,當時估值為 8.75 億美元。
Achim 指出,Harmonic 透過讓 Aristotle 使用開源程式語言 Lean 產生回應來實現超準確的解決方案。在給出答案前,模型會透過不涉及 AI 的演演算法過程進行雙重檢查以確保正確性。Harmonic 執行長表示,類似技術用於醫療裝置和航空等高風險領域的輸出驗證。儘管在狹窄領域實現無幻覺表現極具挑戰性,研究發現即使是領先的 AI 模型也會產生大量幻覺,且問題似乎並未改善,OpenAI 最新的 AI 推理模型甚至比舊版幻覺更多。