文章
所有發布的 AI 新聞與論文。
-
OpenAI 推出 GPT-5
OpenAI 於週四正式推出 GPT-5,這是一款全新的旗艦 AI 模型,將驅動公司下一代 ChatGPT 服務。GPT-5 是 OpenAI 首款「統一」AI 模型,結合了 o 系列模型的推理能力與 GPT 系列的快速回應速度。該模型標誌著 ChatGPT 的新時代,指向 OpenAI 更廣泛的願景,即開發更像代理而非聊天機器人的 AI 系統。與 GPT-4 主要提供智慧問答不同,GPT-5 允許 ChatGPT 代表使用者完成多種任務,例如生成軟體應用程式、管理日曆或撰寫研究簡報。 OpenAI 執行長 Sam Altman 在記者會上宣稱 GPT-5 是「世界上最棒的模型」,並表示這是通往人工通用智慧(AGI)的重要一步。自週四起,GPT-5 將成為所有免費 ChatGPT 使用者的預設模型,這是公司首次讓免費使用者接觸到 AI 推理模型。OpenAI 首席聊天機器人副總裁 Nick Turley 表示,這是為了讓更多人受益。 在效能方面,GPT-5 在多個領域略勝於競爭對手,包括 Anthropic、Google DeepMind 和 Elon Musk 的 xAI。在 SWE-bench Verified 編碼測試中,GPT-5 首次嘗試得分為 74.9%,僅次於 Claude Opus 4.1 的 74.5%。在衡量數學、人文與自然科學的 Humanity's Last Exam 測試中,GPT-5 Pro 使用工具得分為 42%,略低於 xAI 的 Grok 4 Heavy 的 44.4%。然而,在 GPQA Diamond 博士級科學問題測試中,GPT-5 Pro 首次嘗試得分為 89.4%,優於 Claude Opus 4.1 的 80.9% 和 Grok 4 Heavy 的 88.9%。 OpenAI 強調 GPT-5 在醫療相關問題上表現更佳。在 HealthBench Hard Hallucinations 測試中,GPT-5 的幻覺率僅為 1.6%,遠低於 GPT-4o 的 12.9% 和 o3 的 15.8%。在 Tau-bench 代理
-
高成本與低利潤威脅AI程式開發新創公司
AI 編碼創業公司 Windsurf 在二月份曾與 Kleiner Perkins 洽談以 28.5 億美元估值融資,但最終未成。隨後在四月,傳聞其計劃以約 30 億美元估值出售給 OpenAI,但該交易亦告失敗。內部人士指出,儘管 AI 編碼助手備受矚目,但許多公司如 Windsurf 實際上面臨巨大的虧損壓力,因為其運營成本高於收費,導致毛利為負。這主要歸因於使用大型語言模型(LLMs)的高昂費用,尤其是為了提供最新編碼功能,必須使用像 Anthropic 和 OpenAI 等供應商提供的昂貴模型。市場競爭激烈,對手包括擁有龐大客戶群的 Cursor 和 GitHub Copilot。改善利潤率的途徑之一是自建模型以消除供應商費用,但 Windurf 的聯合創始人兼執行長 Varun Mohan 最終決定不採取此舉,認為這風險過高。出售公司被視為一種戰略,旨在鎖定高回報,避免被供應商開價或競爭對手搶奪市場。這種利潤壓力可能也影響了 Cursor 的母公司 Anysphere。Anysphere 拒絕了 OpenAI 的收購,並計劃自建模型以控制成本。然而,LLM 推論成本並未如預期下降,部分新模型因處理複雜任務而成本上升。Anysphere 在七月從 Anthropic 招聘員工後,這些員工僅兩週便返回原公司。OpenAI 推出的 GPT-5 費用低於 Anthropic 的 Claude Opus 4.1,Anysphere 隨即調整 Cursor 的定價結構,將增加的成本轉嫁給使用者,引發客戶不滿,CEO Michael Truell 隨後發表部落格致歉。儘管 Cursor 在六月達到 5 億美元年度營收,但使用者忠誠度仍受威脅。Windsurf 的創始團隊最終離開並加入 Google,關鍵股東獲得 24 億美元報酬,剩餘業務則出售給 Cognition。儘管有批評聲浪,但相關人士認為此交易最大化了員工利益。其他如 Replit、Lovable 和 Bolt 等快速成長的 AI 編碼工具同樣依賴模型供應商,這引發了對其他新興產業能否在模型供應商之上建立自身能力的擔憂。
-
特斯拉關閉Dojo超級電腦 這台馬斯克曾說是全自動駕駛關鍵的AI訓練機器
特斯拉正解散其超級電腦 Dojo 團隊,標誌著該車企停止開發自研晶片以推動無人駕駛技術的計劃。根據彭博社報導,Dojo 負責人彼得·班農將離職,剩餘成員將被調派至特斯拉內部其他資料中心與運算專案。此次解散伴隨著約 20 名員工離開,他們創立了一家名為 DensityAI 的新公司,該公司即將脫離隱蔽狀態,專注於開發驅動機器人、AI 代理及汽車應用資料中心的晶片、硬體與軟體。DensityAI 由前 Dojo 負責人甘尼什·文卡塔拉曼南以及前特斯拉員工比爾·錢和班·弗洛林共同創立。 這一轉變發生在特斯拉關鍵時刻,執行長埃隆·馬斯克一直推動股東將特斯拉視為 AI 與機器人公司,儘管該公司於今年六月在奧斯汀推出的機器人計程車專案因涉及 Model Y 車輛且乘客席有人員,導致出現多起駕駛行為異常事件。馬斯克自 2019 年以來便談論 Dojo,並將其視為實現完全自動駕駛的核心,認為其能處理海量影片資料。摩根士丹利曾預測 Dojo 可為公司市場價值增加 5000 億美元。然而,Dojo 專案於 2024 年 8 月左右停滯,馬斯克開始推廣位於奧斯汀特斯拉總部的 Cortex 超級叢集。 特斯拉在 2021 年首次 AI 日展示了 D1 晶片,並計劃推出解決資訊流瓶頸的 D2 晶片。現在,特斯拉計劃增加對英偉達及其他外部技術夥伴如 AMD 和三星的依賴。上月,特斯拉與三星簽訂了 165 億美元的協議,用於生產 AI6 推理晶片,該晶片設計旨在從 FSD 和 Optimus 人形機器人擴充套件至資料中心的高效能 AI 訓練。在第二季財報會議上,馬斯克曾暗示 Dojo 3 與 AI6 晶片可能存在整合。同時,特斯拉董事會向馬斯克提供 290 億美元的薪酬包,以挽留其專注於特斯拉的 AI 發展,避免其過度分散精力於 xAI 等其他公司。
-
xAI法務長因風暴年份辭職
xAI 首席法律官羅伯特·基爾(Robert Keele)於本週宣佈辭職,任期僅略超過一年。他稱希望將更多時間花在兩個幼兒身上,並承認與老闆埃隆·馬斯克(Elon Musk)之間存在「世界觀的差異」。基爾在 X 和 LinkedIn 上發文表示,雖然他認為在 AI 創業公司的工作經歷「令人難以忘懷」,與馬斯克共事是「一生難忘的冒險」,但他無法同時兼顧家庭與工作。 基爾於 2024 年 5 月加入 xAI,當時該公司剛完成由 Andreessen Horowitz 和 Sequoia Capital 領投的 60 億美元 B 輪融資,估值達 240 億美元。隨後 xAI 迅速成長,並於今年 3 月收購馬斯克的社交媒體公司 X,馬斯克當時表示 xAI 估值為 800 億美元,X 估值為 330 億美元。基爾此前曾短暫經營自己的法律事務所,隨後在 Elroy Air 擔任法律主管,並在 Airbus 矽谷創新中心任職。 接任者為莉莉·林(Lily Lim),她曾是 NASA 的火箭科學家,負責金星表面測繪專案的太空船導航工作。林於 2024 年底加入 xAI,此前曾在 ServiceNow 等公司擔任法律職務。基爾的離職反映了馬斯克帝國中持續的高層人員流動,包括 X 執行長琳達·雅卡里諾(Linda Yaccarino)上月離任,以及特斯拉近期失去多名高管。馬斯克公開期望員工長時間工作,甚至需在公司睡覺,這在收購 X 時曾發生。此外,其他新創公司如 AI 編碼起點 Cognition 也似乎採用了類似心態,其執行長近期在郵件中表示不認為工作與生活平衡是必要的。