西班牙新創公司 Multiverse Computing 正致力於解決大型語言模型體積龐大的問題,透過其壓縮技術 CompactifAI 縮小模型規模,旨在縮小前沿模型與企業實際部署能力之間的差距。該技術靈感來自量子計算,並已應用於 OpenAI 發布的模型。目前開發者可在 Hugging Face 免費獲取 Multiverse 最新版的 HyperNova 60B 模型。此模型僅需 32GB 記憶體,約為源模型 OpenAI gpt-oss-120b 的一半大小,同時具備更低的記憶體使用量和延遲。更新後的 HyperNova 60B 2602 版本進一步支援工具呼叫與代理程式編碼,後者推論成本較高。Multiverse 聲稱其模型在體積更小的情況下,效能與準確度幾乎與競爭對手 Mistral Large 3 相當。Mistral Large 3 由法國科技巨頭 Mistral AI 發布。兩家公司均為歐洲企業,且業務已擴充套件至美國、加拿大及歐洲各地,並擁有企業客戶,包括 Iberdrola、Bosch 及加拿大銀行。雖然 Multiverse 尚未正式成為獨角獸,但傳聞其正在籌資 5 億歐元,估值超過 15 億歐元。公司確認正與潛在投資者進行討論,但拒絕評論估值或融資規模,亦未確認其年復合營收(ARR)在 1 月達到 1 億歐元的報導。若此資料屬實,雖遠低於 OpenAI 的 200 億美元 ARR,但已接近 Mistral 超過 40 億美元的營收水平,部分原因在於對美國科技替代品的需求增長。Multiverse 定位為能提供涵蓋 AI 全棧的主權解決方案。此外,地緣政治因素助其與西班牙阿拉貢地區政府合作,西班牙技術轉型局(SETT)亦參與了其去年的 2.15 億美元 B 輪融資。自成立以來,Multiverse 一直受惠於巴斯克地區的支援,該地區可能即將誕生其首隻獨角獸。
西班牙「soonicorn」企業Multiverse Computing推出免費壓縮AI模型
分享這篇文章: