訊飛智慧投資五千万美元建置用於程式碼與文字的擴散模型

隨著大量資金湧入 AI 創業公司，擁有新想法的 AI 研究者現在是時候去測試了。如果想法足夠新穎，獨立公司可能比大實驗室更容易獲得所需資源。這正是 Inception 的故事，這是一家開發基於擴散模型的 AI 模型的創業公司，剛剛籌資 5000 萬美元。該輪融資由 Menlo Ventures 主導，參與機構包括 Mayfield、Innovation Endeavors、Microsoft 的 M12 基金、Snowflake Ventures、Databricks Investment 以及 Nvidia 的投資部門 NVentures。Andrew Ng 和 Andrej Karpathy 也提供了額外的天使投資。該專案的領導者是斯坦福大學教授 Stefano Ermon，他的研究專注於擴散模型，這種模型透過迭代 refinement 生成輸出，而非逐字生成。這些模型驅動了 Stable Diffusion、Midjourney 和 Sora 等基於影象的 AI 系統。Ermon 自 AI boom 之前就開始研究這些系統，現在他利用 Inception 將這些模型應用於更廣泛的任務。

與資金同時，公司推出了其 Mercury 模型的新版本，專為軟體開發設計。Mercury 已經整合進 ProxyAI、Buildglare 和 Kilo Code 等多個開發工具中。Ermon 表示，擴散方法將幫助 Inception 的模型在延遲（response time）和計算成本這兩個最重要指標上節省資源。他說，這些基於擴散的 LLM 比其他人今天構建的都要快且高效，這是一種完全不同的方法，仍有大量創新可以帶來。

理解技術差異需要一些背景知識。擴散模型在結構上與主導文字 AI 服務的自回歸模型不同。像 GPT-5 和 Gemini 這樣的自回歸模型是順次執行的，根據先前處理的材料預測下一個詞或詞片段。擴散模型是為影象生成訓練的，採用更整體的方法，逐步修改回應的整體結構，直到匹配所需結果。傳統觀點認為應使用自回歸模型處理文字應用，這對於最近一代 AI 模型非常成功。但越來越多的研究表明，當模型處理大量文字或管理資料約束時，擴散模型可能表現更好。Ermon 指出，當在大型程式碼庫上執行操作時，這些品質成為真正的優勢。

擴散模型在利用硬體方面也有更大的靈活性，這在 AI 基礎設施需求日益明顯時特別重要。自回歸