文章
所有發布的 AI 新聞與論文。
-
DeepSeek預覽新AI模型,縮小與頂尖模型的差距
中國人工智慧實驗室 DeepSeek 推出了其最新大型語言模型 DeepSeek V4 的兩個預覽版本,分別為 V4 Flash 和 V4 Pro。這是對去年 V3.2 模型及其伴隨的 R1 推理模型的重大更新。兩款模型均採用專家混合架構,上下文視窗均為 100 萬個 token,足以處理大型程式碼庫或檔案。專家混合方法透過僅在特定任務中啟用部分引數來降低推理成本。V4 Pro 模型擁有 1.6 兆總引數(490 億活躍引數),使其成為目前最大的開放權重模型,超越了 Moonshot AI 的 Kimi K 2.6(1.1 兆)、MiniMax 的 M1(4560 億)以及兩倍於 DeepSeek V3.2(6710 億)的規模。較小的 V4 Flash 擁有 2840 億引數(130 億活躍引數)。DeepSeek 表示,由於架構改進,V4 系列在推理基準測試中幾乎追平了當前領先的開放和封閉模型,其 V4-Pro-Max 在推理基準上優於開放原始碼同儕,並在部分任務上超越 OpenAI 的 GPT-5.2 和 Gemini 3.0 Pro。在程式碼競賽基準中,V4 兩款模型的表現被描述為與 GPT-5.4 相當。然而,在知識測試中,這些模型似乎略遜於前沿模型,特別是 OpenAI 的 GPT-5.4 和 Google 的最新 Gemini 3.1 Pro,這種差距表明其發展軌跡比最先進的前沿模型晚了約 3 到 6 個月。與許多封閉原始碼同儕不同,V4 Flash 和 V4 Pro 目前僅支援文字輸入。值得注意的是,DeepSeek V4 比任何現有的前沿模型都更具成本效益。V4 Flash 的輸入 token 價格為每百萬 0.14 美元,輸出 token 為每百萬 0.28 美元,低於 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 和 Claude Haiku 4.5。V4 Pro 的輸入 token 價格為每百萬 0.1
-
又一項AI晶片的重大進展,Meta簽約取得數百萬顆Amazon AI CPU
亞馬遜與 Meta 達成重要協議,將使用數百萬顆自研的 AWS Graviton 晶片來滿足其日益增長的 AI 需求。AWS Graviton 是一款基於 ARM 架構的中央處理器,專門用於處理通用計算任務,而非用於訓練大型模型的 GPU。儘管 GPU 仍是訓練模型的首選,但基於這些模型構建的 AI 代理在執行即時推理、程式設計、搜尋及多步驟任務協調等密集型運算時,對晶片提出了新要求。亞馬遜表示,其最新版本的 Graviton 正是為應對 AI 相關運算需求而設計。此協議有助於將 Meta 的資金迴流至亞馬遜,而非其競爭對手如 Google Cloud。去年八月,Meta 曾與 Google Cloud 簽訂一份六年期、價值十億美元的合約,此前 Meta 主要使用 AWS 與 Microsoft Azure 的服務。值得注意的是,亞馬遜選擇在 Google Cloud Next 會議結束時宣佈此協議,彷彿在向雲端計算競爭對手發出虛無的微笑。Google 在該會議上展示了其自研 AI 晶片的新版本。亞馬遜雖也擁有自研 AI GPU Trainium,該晶片可用於訓練與推理階段,但 Anthropic 公司此前已與亞馬遜簽訂協議,承諾在未來十年內投入一百億美元執行其工作負載,並特別聚焦於 Trainium 晶片,亞馬遜則同意額外投資五億美元(總投資達十三億美元)以換取合作。Meta 與亞馬遜的協議使亞馬遜得以將 Meta 作為其自研 CPU 的成功案例,這些晶片與 Nvidia 新推出的 Vera CPU 競爭,後者同樣基於 ARM 架構且專為 AI 代理運算設計。Nvidia 向企業和雲提供商銷售晶片與系統,而亞馬遜僅透過其雲服務提供晶片訪問。本月早些時候,亞馬遜執行長 Andy Jassy 在股東信中批評 Nvidia 與 Intel,指出企業希望獲得更好的 AI 價格效能比,並表示亞馬遜將以此為基礎爭取合約。這也意味著亞馬遜內部晶片團隊面臨巨大壓力,必須交付符合市場需求的產品。
-
百瑞 Taylor 的 Sierra 購買 YC 支持的 AI 新創公司 Fragment
美國客戶服務代理啟動公司 Sierra 於週四宣佈收購由 YC 支援的法國啟動公司 Fragment,該公司協助企業將人工智慧整合進工作流程中。這是 Sierra 的第三項公開收購,此前它已於三月晚些時候收購了日本企業人工智慧解決方案公司 Opera Tech 以及語音代理公司 Receptive AI。Fragment 的共同創始人 Olivier Moindrot 和 Guillaume Genthial 將加入 Sierra 團隊。Sierra 創辦人 Bret Taylor 及其共同創辦人 Clay Bavor 在部落格文章中表示,Moindrot 和 Genthial 將為 Sierra 在法國的「代理開發工作」帶來寶貴的實力。交易條款尚未公佈。PitchBook 估計 Fragment 透過種子輪籌資約 200 萬美元。Taylor 同時擔任 OpenAI 董事會主席,他在 2023 年初辭去 Salesforce 共同執行長職務後,與 Google 校友 Bavor 共同創立了 Sierra。該啟動公司宣稱 Casper、Clear 和 Brex 為客戶,迄今已籌資超過 6.3 億美元,投資機構包括 Sequoia 和 Benchmark,估值達 100 億美元。
-
認識 Noscroll,一個能為你進行無止境刷訊息的 AI 好幫手
新創公司 Noscroll 推出了一款由 AI 驅動的機器人服務,旨在解決使用者在社交媒體上無止盡刷取資訊(doomscrolling)的問題。該服務由前 NFT 市場 OpenSea 的技術長 Nadav Hollander 於 2026 年 4 月創立,他因對平臺 X 既愛又恨的複雜情感而開發此產品。Hollander 指出,雖然 X 提供大量資訊且娛樂性強,但其文化充滿毒性,閱讀後令人感到不適,因此他希望建立一個能過濾雜訊、僅傳送重要訊號的工具。 Noscroll 透過文字訊息與 AI 代理互動,使用者可透過傳送文字至 (415) 718-4828 並連結 X 帳號來開始使用。該系統會讀取來自 X、新聞網站、Reddit、Hacker News、Substack 以及研究論文等多種來源的資訊。使用者可以自然語言設定關注的議題或排除的型別,AI 會根據這些偏好整理成摘要。服務提供兩種主要模式:一是定期傳送包含新聞連結與 AI 摘要的日誌,頻率可從每週一次調整至每日多次;二是針對突發新聞即時傳送文字通知。 目前訂閱費用為每月 9.99 美元,但使用者可先免費獲得七日試用期以自訂興趣並取消訂閱。該服務不僅適用於科技產業追蹤 AI 新聞,也被用於追蹤動畫產業、京都當地餐廳、工作機會、解僱追蹤以及地方政治等領域。據稱該產品已獲得投資者關注,並吸引許多需要緊密追蹤特定領域資訊的專業人士使用。使用者可透過 noscroll.com 網站的「Text your agent」按鈕立即嘗試此服務。