分類: 模型與研究
「模型與研究」分類的 AI 新聞與論文。
-
Cohere 發佈開放式多語言模型系列
企業人工智慧公司 Cohere 在印度 AI 峰會期間推出了新一代多語言模型系列 Tiny Aya。這些模型採用開放權重設計,程式碼公開可供任何人使用與修改,支援超過七十種語言,且能在筆記型電腦等日常裝置上執行,無需網路連線。該系列由 Cohere Labs 研發,特別強化對孟加拉語、印地語、旁遮普語、烏爾都語、古吉拉特語、泰米爾語、泰盧固語及馬拉地語等南亞語言的支援。基礎模型包含 33.5 億個引數。Cohere 同時推出了針對指令遵循最佳化的 TinyAya-Global 版本,適用於需要廣泛語言支援的應用程式。此外,該系列還包含區域變體:TinyAya-Earth 專注非洲語言、TinyAya-Fire 針對南亞語言、TinyAya-Water 則涵蓋亞太、西歐及歐洲。Cohere 表示,這種方法能讓各模型發展出更強的語言基礎與文化細微差別,使系統對服務社群更自然可靠,同時保留廣泛的多語言覆蓋率。這些模型使用單一由 64 張 Nvidia H100 晶片組成的叢集訓練,並利用相對適中的計算資源,適合開發者為講母語的使用者群體建立應用程式。模型可直接在裝置上執行,支援離線翻譯。Cohere 已將模型發布於 HuggingFace 和 Cohere Platform,開發者可在 HuggingFace、Kaggle 和 Ollama 下載以進行本地部署,公司亦將發布訓練與評估資料集及技術報告。Cohere 執行長 Aidan Gomez 曾表示公司計劃近期上市,根據 CNBC 報導,該公司於 2025 年結束時表現強勁,年度經常性營收達 2.4 億美元,且全年逐季成長 50%。
-
微小創投 Arcee AI 從頭建立 4000億參數開源 LLM,超越 Meta 的 Llama
美國小型創業公司 Arcee AI 挑戰了大科技壟斷 AI 模型市場的現狀,宣佈發布名為 Trinity 的通用基礎模型。該模型採用 Apache 許可證,被宣稱為美國公司訓練並發布的最大開源基礎模型之一,引數數量達 400B。根據測試,Trinity 在程式設計、數學、常識、知識和推理等任務上表現優異,部分測試結果甚至略勝 Meta 的 Llama 4 Maverick 400B 和中國清華大學 Z.ai 的 GLM-4.5。儘管目前僅支援文字輸入,尚未具備多模態能力,但 Arcee AI 強調其目標是讓開發者和學者信服,並試圖將美國企業從依賴中國開源模型轉為使用美國本土模型。 Arcee AI 在六個月內耗資 2000 萬美元,動用 2048 張 Nvidia Blackwell B300 晶片完成了 Trinity 系列模型的訓練,包括 26B 引數的 Trinity Mini 和 6B 引數的 Trinity Nano。公司創辦人 Mark McQuade 指出,Trinity 系列將提供三種版本:Trinity Large Preview、Trinity Large Base 以及可自由客製化的 TrueBase。所有模型均可免費下載,預計大版本將推出六週內。此外,Arcee AI 已推出 Trinity Mini 的 API 服務,價格為每百萬字元 0.045 美元或 0.15 美元,並提供限額免費層級。公司承諾透過 Apache 許可證確保模型永久開源,以應對 Meta 等公司對開源策略的變動,並致力於建立美國獨立的 frontier-grade 開源 AI 實驗室。
-
中國的月躍計畫發布全新開源模型Kimi K2.5及程式碼代理人
中國 Moonshot AI 公司今日發布了全新開源模型 Kimi K2.5,該模型由阿里巴巴和紅杉中國(前 Sequoia China)等機構支援,具備理解文字、圖片與影片的原生多模態能力。模型基於 15 兆混合視覺與文字 token 訓練而成,在程式設計任務與代理群組協作方面表現優異。在公開測試中,Kimi K2.5 在 SWE-Bench Verified 程式設計 benchmarks 上超越 Gemini 3 Pro,在 SWE-Bench Multilingual 上分數高於 GPT 5.2 和 Gemini 3 Pro;在 VideoMMMU 影片理解測試中,其表現優於 GPT 5.2 和 Claude Opus 4.5。Moonshot AI 表示,使用者可透過文字、圖片或影片輸入,要求模型生成類似介面的程式碼。為此,公司推出了開源程式設計工具 Kimi Code,可與 VSCode、Cursor 和 Zed 等開發工具整合,並支援多模態輸入。該工具被視為與 Anthropic 的 Claude Code 及 Google 的 Gemini CLI 競爭的產品。程式設計工具已成為 AI 實驗室的重要收入來源,Anthropic 於十一月宣佈 Claude Code 年復合營收(ARR)達十億美元,Wired 報導稱該工具於二零二五年末已增加一億美元營收。Moonshot AI 由前 Google 與 Meta AI 研究員楊志霖創立,曾在 B 輪融資中獲得十億美元資金,估值為二十五億美元;彭博社報導,該公司上月又獲五百萬美元資金,估值升至四十三億美元,並正尋求以五十億美元估值進行下一輪融資。
-
Meta正在研發新的圖像與視頻模型預計2026年推出,報導指出
Meta 正在其由 Scale AI 共同創辦人 Alexandr Wang 領導的超級智慧實驗室下開發新的人工智慧模型。據《華爾街日報》報導,該公司目前正開發一個名為「Mango」的影像與影片模型,以及一個內部代號為「Avocado」的文字模型。Meta 計劃於 2026 年上半季推出這些新模型,此訊息源於 Meta 於週四舉行的內部問答會,Wang 與首席產品官 Chris Cox 在會上揭曉了新路線圖。Wang 表示,Meta 的目標是讓文字模型在程式編寫方面更優異,並探索能理解視覺資訊、無需針對所有可能性進行訓練即可推理、規劃與行動的新世界模型。然而,Meta 在人工智慧競賽中已落後於 OpenAI、Anthropic 和 Google 等競爭對手。該公司的人工智慧部門今年經歷了重大重組,包括領導層變動及從其他頂尖公司挖角研究人員,但部分加入 Meta 超級智慧實驗室的研究人員已離職。上月,該公司首席人工智慧科學家 Yann LeCun 也宣佈將離職創立自己的創業公司。目前 Meta 尚未擁有成功的人工智慧產品,其 Meta AI 助手的使用資料主要依賴於該公司覆蓋數十億使用者的現有社交網路,因為該助手被置於其應用程式的搜尋列中。這意味著從 MSL 流出的首批專案與模型將面臨巨大壓力。