文章
所有發布的 AI 新聞與論文。
-
百瑞 Taylor 的 Sierra 購買 YC 支持的 AI 新創公司 Fragment
美國客戶服務代理啟動公司 Sierra 於週四宣佈收購由 YC 支援的法國啟動公司 Fragment,該公司協助企業將人工智慧整合進工作流程中。這是 Sierra 的第三項公開收購,此前它已於三月晚些時候收購了日本企業人工智慧解決方案公司 Opera Tech 以及語音代理公司 Receptive AI。Fragment 的共同創始人 Olivier Moindrot 和 Guillaume Genthial 將加入 Sierra 團隊。Sierra 創辦人 Bret Taylor 及其共同創辦人 Clay Bavor 在部落格文章中表示,Moindrot 和 Genthial 將為 Sierra 在法國的「代理開發工作」帶來寶貴的實力。交易條款尚未公佈。PitchBook 估計 Fragment 透過種子輪籌資約 200 萬美元。Taylor 同時擔任 OpenAI 董事會主席,他在 2023 年初辭去 Salesforce 共同執行長職務後,與 Google 校友 Bavor 共同創立了 Sierra。該啟動公司宣稱 Casper、Clear 和 Brex 為客戶,迄今已籌資超過 6.3 億美元,投資機構包括 Sequoia 和 Benchmark,估值達 100 億美元。
-
又一項AI晶片的重大進展,Meta簽約取得數百萬顆Amazon AI CPU
亞馬遜與 Meta 達成重要協議,將使用數百萬顆自研的 AWS Graviton 晶片來滿足其日益增長的 AI 需求。AWS Graviton 是一款基於 ARM 架構的中央處理器,專門用於處理通用計算任務,而非用於訓練大型模型的 GPU。儘管 GPU 仍是訓練模型的首選,但基於這些模型構建的 AI 代理在執行即時推理、程式設計、搜尋及多步驟任務協調等密集型運算時,對晶片提出了新要求。亞馬遜表示,其最新版本的 Graviton 正是為應對 AI 相關運算需求而設計。此協議有助於將 Meta 的資金迴流至亞馬遜,而非其競爭對手如 Google Cloud。去年八月,Meta 曾與 Google Cloud 簽訂一份六年期、價值十億美元的合約,此前 Meta 主要使用 AWS 與 Microsoft Azure 的服務。值得注意的是,亞馬遜選擇在 Google Cloud Next 會議結束時宣佈此協議,彷彿在向雲端計算競爭對手發出虛無的微笑。Google 在該會議上展示了其自研 AI 晶片的新版本。亞馬遜雖也擁有自研 AI GPU Trainium,該晶片可用於訓練與推理階段,但 Anthropic 公司此前已與亞馬遜簽訂協議,承諾在未來十年內投入一百億美元執行其工作負載,並特別聚焦於 Trainium 晶片,亞馬遜則同意額外投資五億美元(總投資達十三億美元)以換取合作。Meta 與亞馬遜的協議使亞馬遜得以將 Meta 作為其自研 CPU 的成功案例,這些晶片與 Nvidia 新推出的 Vera CPU 競爭,後者同樣基於 ARM 架構且專為 AI 代理運算設計。Nvidia 向企業和雲提供商銷售晶片與系統,而亞馬遜僅透過其雲服務提供晶片訪問。本月早些時候,亞馬遜執行長 Andy Jassy 在股東信中批評 Nvidia 與 Intel,指出企業希望獲得更好的 AI 價格效能比,並表示亞馬遜將以此為基礎爭取合約。這也意味著亞馬遜內部晶片團隊面臨巨大壓力,必須交付符合市場需求的產品。
-
DeepSeek預覽新AI模型,縮小與頂尖模型的差距
中國人工智慧實驗室 DeepSeek 推出了其最新大型語言模型 DeepSeek V4 的兩個預覽版本,分別為 V4 Flash 和 V4 Pro。這是對去年 V3.2 模型及其伴隨的 R1 推理模型的重大更新。兩款模型均採用專家混合架構,上下文視窗均為 100 萬個 token,足以處理大型程式碼庫或檔案。專家混合方法透過僅在特定任務中啟用部分引數來降低推理成本。V4 Pro 模型擁有 1.6 兆總引數(490 億活躍引數),使其成為目前最大的開放權重模型,超越了 Moonshot AI 的 Kimi K 2.6(1.1 兆)、MiniMax 的 M1(4560 億)以及兩倍於 DeepSeek V3.2(6710 億)的規模。較小的 V4 Flash 擁有 2840 億引數(130 億活躍引數)。DeepSeek 表示,由於架構改進,V4 系列在推理基準測試中幾乎追平了當前領先的開放和封閉模型,其 V4-Pro-Max 在推理基準上優於開放原始碼同儕,並在部分任務上超越 OpenAI 的 GPT-5.2 和 Gemini 3.0 Pro。在程式碼競賽基準中,V4 兩款模型的表現被描述為與 GPT-5.4 相當。然而,在知識測試中,這些模型似乎略遜於前沿模型,特別是 OpenAI 的 GPT-5.4 和 Google 的最新 Gemini 3.1 Pro,這種差距表明其發展軌跡比最先進的前沿模型晚了約 3 到 6 個月。與許多封閉原始碼同儕不同,V4 Flash 和 V4 Pro 目前僅支援文字輸入。值得注意的是,DeepSeek V4 比任何現有的前沿模型都更具成本效益。V4 Flash 的輸入 token 價格為每百萬 0.14 美元,輸出 token 為每百萬 0.28 美元,低於 GPT-5.4 Nano、Gemini 3.1 Flash、GPT-5.4 Mini 和 Claude Haiku 4.5。V4 Pro 的輸入 token 價格為每百萬 0.1
-
Uber 首席技術長普拉韋恩.內帕尼尼加入 StrictlyVC 與舊金山活動陣容
StrictlyVC 於 4 月 30 日在 Sentro Filipino Cultural Center 舉辦今年活動,並新增 Uber 技術長 Praveen Neppalli Naga 為嘉賓,探討 AI 時代的大規模運營。Naga 自 2015 年加入 Uber,曾參與開發司機與外送員的薪酬系統,並曾主導 LinkedIn 早期產品與基礎設施建設。本次活動將由 TechCrunch 總編輯 Connie Loizos 主持對話,涵蓋 AI 革命下複雜系統的構建。目前活動已有五位嘉賓,包括 Eclipse 創辦人兼 CEO Lior Susan,其近期籌資 13 億美元的基金專注於實體 AI 創業公司,將分享投資關注的專案;Replit 共同創辦人兼 CEO Amjad Masad 將介紹 AI 驅動軟體開發的未來,回應工程師對 AI 編碼能力的擔憂。活動贊助商 TDK Ventures 總裁 Nicolas Sauvage 將主持關於從戰略後援籌資及早期投資的對話,而前 CNN 主持人兼 Meta 媒體合作負責人 Campbell Brown 則將分享加入創業圈的經歷,並探討如何應對 AI 誤用引發的假訊息問題。活動旨在為創業者與投資者提供網路擴充套件與社群連結的單一解決方案,建議立即搶購門票。