尋找AI運算力的競賽是否發現了下一個Cerebras？

AI 模型運算需求激增，但企業面臨取得合適晶片及部署至資料中心的挑戰。General Compute 作為一家專注於推理階段的 AI 新雲端服務商，提供瞭解決方案。該公司近日以 6000 萬美元後市估值完成 1500 萬美元種子輪融資，由 FUSE VC 領投，Carya Venture Partners 和 Village Global Ventures 跟投。由於 NVIDIA 的 Groq 晶片與 Cerebras 晶片供不應求，General Compute 轉向採用 Intel 支援的 SambaNova 公司製作的專用推理晶片。SambaNova 宣稱其新晶片在推理速度上優於 GPU 及其他專用晶片，可產生每秒 600 至 700 個 token，而 GPU 僅約 250 個。General Compute 已訂購 3 億美元的 SN50 晶片，並計劃成為首家部署該晶片的新雲端服務商。這些晶片採用風冷設計，功耗較低，無需額外基礎設施即可安裝於現有資料中心。General Compute 正與資料中心提供商及加密貨幣礦工簽署 colocate 協議，以降低成本。該公司上週推出雲端服務，宣稱執行 MiniMax 2.7 開源大語言模型的速度最快。投資者 Joe Hasselmann 指出，General Compute 與 SambaNova 的合作關係類似於 CoreWeave 與 NVIDIA 的過往合作。OpenRouter 本週剛完成 1.13 億美元的 B 輪融資，反映市場對多模型接入及推理速度的重視。General Compute 目標將程式設計代理的數小時工作縮短至五至十分鐘，並提升客服語音代理的經濟性與速度。