迷思特以新開放權重邊境與小模型接近大型AI競爭對手

法國人工智慧新創公司 Mistral 於週二推出了全新的 Mistral 3 系列開放權重模型，旨在證明其在讓 AI 公開可用及服務企業客戶方面能超越大型科技競爭對手。此次發布包含一個具備多模態與多語言能力的 frontier 大模型，以及九個小型離線可用且可完全自訂的模型。Mistral 由前 DeepMind 與 Meta 的研究人員創立，兩年前成立，目前籌資約 27 億美元，估值為 137 億美元，遠低於競爭對手 OpenAI（籌資 570 億美元，估值 5000 億美元）與 Anthropic（籌資 450 億美元，估值 350 億美元）。Mistral 共同創辦人兼首席科學家 Guillaume Lample 指出，許多企業客戶發現直接使用大型封閉模型成本高昂且速度緩慢，因此轉向自訂小型模型以更有效率地處理特定用例。

Mistral 的大型 frontier 模型 Mistral Large 3 在功能上追平 OpenAI 的 GPT-4o 與 Google 的 Gemini 2，並具備多模態與多語言能力，與 Meta 的 Llama 3 及阿里巴巴的 Qwen3-Omni 並駕齊驅。該模型採用「精細專家混合」架構，擁有 410 億個活躍引數與 6750 億個總引數，支援 256,000 的上下文視窗，適用於檔案分析、程式編寫、內容創作及工作流自動化。新推出的 Ministral 3 系列則包含九個不同的高效能稠密模型，涵蓋 140 億、80 億與 30 億引數三種規格，並提供 Base、Instruct 與 Reasoning 三種變體。Mistral 聲稱這些小型模型在效能、成本效率及專有能力上優於其他開放權重領導者，且能產生較少的 token。

所有變體均支援視覺功能，處理 128,000 至 256,000 的上下文視窗，並支援多種語言。Mistral 強調其小型模型可在單一 GPU 上執行，使其能部署於廉價硬體，包括本地伺服器、筆記型電腦、機器人及其他邊緣裝置。這