埃隆·馬斯克旗下的 AI 公司 xAI 於週三晚間推出了其旗艦 AI 模型 Grok 4,並宣佈推出每月 300 美元的 SuperGrok Heavy 訂閱計劃。Grok 是 xAI 對 OpenAI 的 ChatGPT 和 Google 的 Gemini 等模型的回應,具備分析圖片和回答問題的能力。馬斯克在直播中表示,Grok 4 在學術問題上表現優於博士水平,儘管偶爾缺乏常識或尚未發明新技術,但這只是時間問題。此次發布正值馬斯克公司經歷動盪的一週,X 平臺前執行長琳達·雅卡里諾(Linda Yaccarino)剛剛辭職,而 Grok 的官方帳號此前曾發布反猶太言論並讚揚希特勒,引發爭議後被暫時限制。
Grok 4 在多個基準測試中展現前沿級表現。在「人類最後的考試」(Humanity’s Last Exam)中,Grok 4 無工具得分 25.4%,超越 Google 的 Gemini 2.5 Pro(21.6%)和 OpenAI 的 o3(21%);使用工具後,Grok 4 Heavy 得分 44.4%,再次領先。在非營利組織 Arc Prize 的 ARC-AGI-2 測試中,Grok 得分 16.2%,幾乎是第二名模型 Claude Opus 4 的兩倍。xAI 還計劃在八月份推出 AI 編碼模型,九月推出多模態代理,十月推出影片生成模型。SuperGrok Heavy 訂閱計劃提供 Grok 4 Heavy 的早期預覽及新功能優先權,是目前主要 AI 供應商中最昂貴的訂閱方案。雖然 Grok 在基準測試中表現出色,但 xAI 仍需克服近期的失誤,以在企業市場與 ChatGPT、Claude 和 Gemini 競爭。