AI 模型運算需求激增,但企業面臨取得合適晶片及部署至資料中心的挑戰。General Compute 作為一家專注於推理階段的 AI 新雲端服務商,提供瞭解決方案。該公司近日以 6000 萬美元後市估值完成 1500 萬美元種子輪融資,由 FUSE VC 領投,Carya Venture Partners 和 Village Global Ventures 跟投。由於 NVIDIA 的 Groq 晶片與 Cerebras 晶片供不應求,General Compute 轉向採用 Intel 支援的 SambaNova 公司製作的專用推理晶片。SambaNova 宣稱其新晶片在推理速度上優於 GPU 及其他專用晶片,可產生每秒 600 至 700 個 token,而 GPU 僅約 250 個。General Compute 已訂購 3 億美元的 SN50 晶片,並計劃成為首家部署該晶片的新雲端服務商。這些晶片採用風冷設計,功耗較低,無需額外基礎設施即可安裝於現有資料中心。General Compute 正與資料中心提供商及加密貨幣礦工簽署 colocate 協議,以降低成本。該公司上週推出雲端服務,宣稱執行 MiniMax 2.7 開源大語言模型的速度最快。投資者 Joe Hasselmann 指出,General Compute 與 SambaNova 的合作關係類似於 CoreWeave 與 NVIDIA 的過往合作。OpenRouter 本週剛完成 1.13 億美元的 B 輪融資,反映市場對多模型接入及推理速度的重視。General Compute 目標將程式設計代理的數小時工作縮短至五至十分鐘,並提升客服語音代理的經濟性與速度。
尋找AI運算力的競賽是否發現了下一個Cerebras?
分享這篇文章: