分類: 基礎設施與硬體
「基礎設施與硬體」分類的 AI 新聞與論文。
-
亞馬遜推出一款令人驚豔的新AI晶片並預告一項親 Nvidia 的發展路線圖
亞馬遜雲服務(AWS)於 2025 年 2 月 25 日在 AWS re:Invent 2025 年大會上正式推出新一代 AI 訓練晶片 Trainium3,並同步啟動 Trainium4 的開發。Trainium3 UltraServer 系統採用公司自研的 3 奈米 Trainium3 晶片及自研網路技術,相比第二代產品在 AI 訓練與推論方面效能提升超過 4 倍,記憶體容量增加 4 倍。單一 UltraServer 可搭載 144 顆晶片,數千臺聯動後可達 100 萬顆晶片規模,效能為前代 10 倍。該系統能耗降低 40%,在資料中心電力需求龐大的背景下,AWS 強調此舉能為客戶節省成本。目前包括 Anthropic、日本 LLM Karakuri、SplashMusic 及 Decart 在內的多家客戶已採用該技術並顯著降低推論費用。針對下一代 Trainium4,AWS 表示將支援 Nvidia 的 NVLink Fusion 高速晶片互連技術,使 AWS 自研伺服器架構能與 Nvidia GPU 協同運作,有助於吸引基於 Nvidia CUDA 架構開發的大型 AI 應用。若依以往節奏,Trainium4 預計將於明年大會進一步披露,但 AWS 尚未公佈具體時間表。
-
此新創公司的金屬堆疊技術或可解決AI巨大的散熱問題
Nvidia 於三月宣佈其 Rubin 系列 GPU 時透露,預計於 2027 年推出的 Ultra 版本晶片所組建的機櫃,電力需求可能高達 600 千瓦,這幾乎是當前最快電動車充電器輸出功率的近兩倍。隨著資料中心機櫃功耗攀升至 480 千瓦並逼近 600 千瓦,如何為包括記憶體與網路晶片等佔伺服器散熱負載約 20% 的周邊元件進行液態散熱,成為工程師面臨的最大挑戰。Alloy Enterprises 開發了一項技術,利用銅片製造固態散熱板,以解決此問題。該公司共同創辦人兼執行長 Ali Forsyth 指出,過去在機櫃功耗為 120 千瓦時,工程師不太在意那 20% 的散熱需求,但現在必須為所有元件進行液態散熱,而目前針對這些部件尚無解決方案。 Alloy 採用一種名為「堆疊鍛造」的擴散結合技術,透過熱壓將金屬片層層堆疊並結合,而非傳統切削或 3D 列印。此過程成本高於傳統切削但低於 3D 列印,最終產出的散熱板為單一金屬塊,無縫隙且無孔隙,其銅材強度等同於切削製品。該技術可製作最小至 50 微米(約人類頭髮寬度一半)的微小特徵,增加冷卻液流動空間。據 Forsyth 表示,Alloy 的散熱板熱效能比競爭對手高出 35%。由於堆疊鍛造技術複雜,Alloy 負責內部設計,客戶僅提供規格與尺寸,公司軟體協助將其轉化為適合製造的形狀。工廠流程包括將銅卷預處理、雷射切割特徵、塗佈阻焊劑,最後將切片堆疊並送入擴散結合機,利用熱壓將其壓合成單一金屬塊。Alloy 最初設計時針對鋁合金,後因資料中心需求轉向銅材,因其導熱佳且抗腐蝕。產品於六月宣佈後引發巨大關注,Alloy 正與資料中心領域的各大廠商合作。
-
英偉達推出全新GPU專為長脈衝推理設計
在週二舉行的 AI 基礎設施峰會上,英偉達宣佈推出名為 Rubin CPX 的新型 GPU,該晶片專為處理超過一百萬 token 的上下文視窗而設計。作為英偉達即將推出的 Rubin 系列的一部分,CPX 經過最佳化以處理大型序列上下文,並旨在作為更廣泛的「解耦推理」基礎架構的一部分使用。對於使用者而言,這將帶來在長上下文任務(如影片生成或軟體開發)上的更佳表現。英偉達持續不斷的發展週期為公司帶來了巨大利潤,其最近一個季度的資料中心銷售額達到 411 億美元。Rubin CPX 預計將於 2026 年底上市。