在週二舉行的 AI 基礎設施峰會上,英偉達宣佈推出名為 Rubin CPX 的新型 GPU,該晶片專為處理超過一百萬 token 的上下文視窗而設計。作為英偉達即將推出的 Rubin 系列的一部分,CPX 經過最佳化以處理大型序列上下文,並旨在作為更廣泛的「解耦推理」基礎架構的一部分使用。對於使用者而言,這將帶來在長上下文任務(如影片生成或軟體開發)上的更佳表現。英偉達持續不斷的發展週期為公司帶來了巨大利潤,其最近一個季度的資料中心銷售額達到 411 億美元。Rubin CPX 預計將於 2026 年底上市。
英偉達推出全新GPU專為長脈衝推理設計
分享這篇文章: