法國人工智慧新創公司 Mistral 於週二推出了全新的 Mistral 3 系列開放權重模型,旨在證明其在讓 AI 公開可用及服務企業客戶方面能超越大型科技競爭對手。此次發布包含一個具備多模態與多語言能力的 frontier 大模型,以及九個小型離線可用且可完全自訂的模型。Mistral 由前 DeepMind 與 Meta 的研究人員創立,兩年前成立,目前籌資約 27 億美元,估值為 137 億美元,遠低於競爭對手 OpenAI(籌資 570 億美元,估值 5000 億美元)與 Anthropic(籌資 450 億美元,估值 350 億美元)。Mistral 共同創辦人兼首席科學家 Guillaume Lample 指出,許多企業客戶發現直接使用大型封閉模型成本高昂且速度緩慢,因此轉向自訂小型模型以更有效率地處理特定用例。
Mistral 的大型 frontier 模型 Mistral Large 3 在功能上追平 OpenAI 的 GPT-4o 與 Google 的 Gemini 2,並具備多模態與多語言能力,與 Meta 的 Llama 3 及阿里巴巴的 Qwen3-Omni 並駕齊驅。該模型採用「精細專家混合」架構,擁有 410 億個活躍引數與 6750 億個總引數,支援 256,000 的上下文視窗,適用於檔案分析、程式編寫、內容創作及工作流自動化。新推出的 Ministral 3 系列則包含九個不同的高效能稠密模型,涵蓋 140 億、80 億與 30 億引數三種規格,並提供 Base、Instruct 與 Reasoning 三種變體。Mistral 聲稱這些小型模型在效能、成本效率及專有能力上優於其他開放權重領導者,且能產生較少的 token。
所有變體均支援視覺功能,處理 128,000 至 256,000 的上下文視窗,並支援多種語言。Mistral 強調其小型模型可在單一 GPU 上執行,使其能部署於廉價硬體,包括本地伺服器、筆記型電腦、機器人及其他邊緣裝置。這