微軟正式推出最新晶片 Maia 200,這是一款專為縮放 AI 推論設計的矽基工作馬。該晶片繼承自 2023 年發布的 Maia 100,在技術上進行了升級,能夠以更快的速度和更高的效率執行強大的 AI 模型。Maia 200 搭載超過 1000 億個電晶體,在 4 位元精度下可提供超過 10 拍 Flops 的運算能力,在 8 位元精度下則提供約 5 拍 Flops 的效能,這相比其前代產品有顯著提升。推論是指執行模型的計算過程,與訓練模型所需的計算不同。隨著 AI 公司成熟,推論成本日益成為營運成本的重要組成部分,因此最佳化該過程備受關注。微軟希望 Maia 200 能參與這一最佳化,讓 AI 業務在更低功耗和更少幹擾的情況下執行。據公司表示,單一 Maia 200 節點即可輕鬆執行當今最大的模型,並為未來更大模型留足餘地。
微軟的新晶片也反映了科技巨頭轉向自研晶片以減少對英偉達依賴的趨勢。例如,Google 擁有 TPU(張量處理單元),而 Amazon 則推出了 Trainium3。這些自研晶片可用於分流原本分配給英偉達 GPU 的計算任務,從而降低整體硬體成本。在微軟的宣告中,Maia 顯示出與這些替代方案的競爭力,其 FP4 效能是第三代 Amazon Trainium 晶片的三倍,FP8 效能則高於 Google 第七代 TPU。微軟表示,Maia 正在推動其超級智慧團隊的 AI 模型執行,並支援 Copilot 聊天機器人的操作。截至星期一,公司已邀請開發者、學者和前沿 AI 實驗室使用 Maia 200 軟體開發套件進行工作負載。