跳至內容
AI 新聞站
返回

訊飛智慧投資五千万美元建置用於程式碼與文字的擴散模型

隨著大量資金湧入 AI 創業公司,擁有新想法的 AI 研究者現在是時候去測試了。如果想法足夠新穎,獨立公司可能比大實驗室更容易獲得所需資源。這正是 Inception 的故事,這是一家開發基於擴散模型的 AI 模型的創業公司,剛剛籌資 5000 萬美元。該輪融資由 Menlo Ventures 主導,參與機構包括 Mayfield、Innovation Endeavors、Microsoft 的 M12 基金、Snowflake Ventures、Databricks Investment 以及 Nvidia 的投資部門 NVentures。Andrew Ng 和 Andrej Karpathy 也提供了額外的天使投資。該專案的領導者是斯坦福大學教授 Stefano Ermon,他的研究專注於擴散模型,這種模型透過迭代 refinement 生成輸出,而非逐字生成。這些模型驅動了 Stable Diffusion、Midjourney 和 Sora 等基於影象的 AI 系統。Ermon 自 AI boom 之前就開始研究這些系統,現在他利用 Inception 將這些模型應用於更廣泛的任務。

與資金同時,公司推出了其 Mercury 模型的新版本,專為軟體開發設計。Mercury 已經整合進 ProxyAI、Buildglare 和 Kilo Code 等多個開發工具中。Ermon 表示,擴散方法將幫助 Inception 的模型在延遲(response time)和計算成本這兩個最重要指標上節省資源。他說,這些基於擴散的 LLM 比其他人今天構建的都要快且高效,這是一種完全不同的方法,仍有大量創新可以帶來。

理解技術差異需要一些背景知識。擴散模型在結構上與主導文字 AI 服務的自回歸模型不同。像 GPT-5 和 Gemini 這樣的自回歸模型是順次執行的,根據先前處理的材料預測下一個詞或詞片段。擴散模型是為影象生成訓練的,採用更整體的方法,逐步修改回應的整體結構,直到匹配所需結果。傳統觀點認為應使用自回歸模型處理文字應用,這對於最近一代 AI 模型非常成功。但越來越多的研究表明,當模型處理大量文字或管理資料約束時,擴散模型可能表現更好。Ermon 指出,當在大型程式碼庫上執行操作時,這些品質成為真正的優勢。

擴散模型在利用硬體方面也有更大的靈活性,這在 AI 基礎設施需求日益明顯時特別重要。自回歸


分享這篇文章:

上一篇
子細計算機的聲學隔離模型協助電腦在嘈雜環境中理解使用者
下一篇
Google Maps 升級印度導航功能搭配 Gemini 提供安全警報