文章
所有發布的 AI 新聞與論文。
-
Guide Labs 發表一種新型可解釋的 LLM
Guide Labs 是一家由 CEO Julius Adebayo 和首席科學官 Aya Abdelsalam Ismail 於 2024 年 11 月從 Y Combinator 孵化並獲得 Initialized Capital 900 萬美元種子輪融資的舊金山創業公司,旨在解決深度學習模型難以解釋的挑戰。該公司今日公開了名為 Steerling-8B 的 80 億引數大型語言模型,該模型採用新架構設計,使其行為具有高度可解釋性。在該架構下,模型產生的每個 token 都能追溯至訓練資料的來源,這使得確定模型引用事實的參考資料或理解其對幽默、性別等概念的認知變得可行。Adebayo 指出,雖然現有模型也能做到,但這種方法非常脆弱,而 Steerling-8B 透過在模型中插入概念層將資料分組為可追蹤類別,將可解釋性從神經科學問題轉變為工程問題。儘管這種方法需要額外的資料標註,但團隊利用其他 AI 模型協助訓練,成功證明瞭其可行性。Adebayo 表示,該模型能達到現有模型 90% 的能力,但使用了更少的訓練資料,並且保留了模型自行發現概念(如量子計算)的突發行為。對於消費級 LLM、受監管行業(如金融)以及科學研究(如蛋白質摺疊),這種可解釋性至關重要,有助於控制版權內容、暴力或藥物濫用等輸出,並讓模型在評估貸款申請時考慮財務記錄而非種族。Guide Labs 的下一步是構建更大規模的模型,並開始向使用者提供 API 和智慧體訪問服務,以實現可解釋性的民主化。
-
OpenAI 請來顧問協助推動企業發展計畫
OpenAI 於本週一宣佈與四家大型諮詢公司建立「邊界聯盟」(Frontier Alliances),旨在透過多年度合作推動企業業務在 2026 年的增長。這些合作夥伴包括波士頓諮詢集團(BCG)、麥肯錫、安永(Accenture)和 Capgemini。OpenAI 的向前部署工程團隊將與這些諮詢巨頭合作,協助他們將 OpenAI Frontier 等企業級技術整合到客戶的技術架構中。OpenAI Frontier 是一款於二月初推出的無程式碼開放軟體,允許使用者構建、部署和管理基於 OpenAI 模型及更廣泛技術的 AI 代理。 BCG 執行長克里斯托夫·施魏策爾表示,僅有 AI 無法驅動轉型,必須將其與戰略連結,並重新設計流程,在對齊激勵措施和文化的基礎上實現規模化採用,才能帶來持續的成果。OpenAI 的聯盟策略不僅是向企業推廣將 AI 融入現有工作流,更著重於透過諮詢師說服企業改變戰略和工作流程,以在合適的時機整合 OpenAI 工具。目前企業對 AI 的採用速度相對緩慢,主要因難以從 AI 專案中獲得有意義的投資回報。值得注意的是,OpenAI 的競爭對手 Anthropic 近期也與德勤和安永等諮詢公司簽署了協議。OpenAI 財務長莎拉·弗瑞爾在一月發表的部落格文章中指出,企業市場是 OpenAI 在 2026 年的重點關注領域。此外,OpenAI 今年已與 Snowflake 和 ServiceNow 簽署了大型企業 AI 協議,並於一月任命巴雷特·佐普(Barret Zoph)領導公司的企業銷售工作。
-
Google 雲端 AI 首席談模型能力的三大領域
Google Cloud 產品副總裁 Michael Gerstenhaber 主要負責 Vertex AI,這是公司統一的企業級 AI 部署平臺。他在訪談中提出,AI 模型正同時面臨三大前沿挑戰:原始智慧、回應速度以及與成本密切相關的第三個維度,即模型能否以低廉成本在巨大且不可預測的規模下執行。他強調,這是一種重新定義模型能力的新思維方式。Gerstenhaber 在 AI 領域工作約兩年,此前曾在 Anthropic 工作一年半,現於 Google 工作近半年。他負責的 Vertex AI 平臺主要服務工程師,提供代理模式、代理平臺以及全球最強大模型的推理能力,而具體應用則由 Shopify、Thomson Reuters 等客戶自行開發。他認為 Google 的獨特優勢在於垂直整合,從介面到基礎設施層(包括資料中心、電力、晶片、模型、推理層、代理層、API 及合規治理)均自掌控,這使其成為推動前沿模型的理想場所。 Gerstenhaber 指出,目前三大科技巨頭的能力差距不大,但競爭不僅僅是追求更高智慧,還涉及複雜的平衡。第一 frontier 是原始智慧,例如編寫程式碼時追求最佳結果,即使耗時 45 分鐘亦可接受;第二 frontier 是延遲,在客戶服務場景中,若回答過於遲緩導致客戶結束通話,再高的智慧也無意義,需在延遲預算內提供最智慧的產品;第三 frontier 是成本與規模,如 Reddit 或 Meta 需要處理海量內容審核,必須在預算限制下以可擴充套件的方式執行高智慧模型。他解釋代理系統普及緩慢的原因在於基礎設施缺失,缺乏審計代理行為和資料授權的模式,且生產環境總是滯後於技術能力。相比之下,Google 因具備軟體開發生命週期中的安全開發環境、雙重審計機制及人工介入流程,能極低風險地將技術落地,但也需其他領域複製這些模式。
-
Anthropic指控中國AI實驗室盜用Claude模型 美國討論AI晶片出口議題
安提克(Anthropic)指控三家中國人工智慧公司——DeepSeek、Moonshot AI 和 MiniMax——利用其 Claude 模型建立了超過 24,000 個虛假帳號,透過名為「蒸餾」(distillation)的技術來提升自身模型。據稱這些實驗室透過這些帳號與 Claude 進行了超過 1600 萬次互動,專門針對 Claude 最具差異化的能力,包括代理推理、工具使用以及程式碼編寫。 此次指控背景複雜,涉及對先進 AI 晶片出口管制的爭議。雖然「蒸餾」本是實驗室用於訓練更小、更便宜版本模型的常見方法,但競爭對手可藉此複製其他實驗室的工作成果。OpenAI 此前也傳送備忘錄指控 DeepSeek 使用此技術模仿其產品。DeepSeek 曾於一年前發布開源推理模型 R1,其效能幾乎媲美美國前沿實驗室,但成本僅為前者的一小部分,並預計即將發布效能優於 Claude 和 ChatGPT 的 DeepSeek V4 模型。 各實驗室攻擊規模不同。安提克追蹤到超過 150,000 次來自 DeepSeek 的互動,旨在改進基礎邏輯與對齊,特別是針對政策敏感查詢的審查安全替代方案。Moonshot AI 則有超過 340 萬次互動,針對代理推理、工具使用、程式碼編寫、資料分析、電腦使用代理開發及電腦視覺。上月該公司發布了開源模型 Kimi K2.5 及編寫代理。MiniMax 的 1300 萬次互動則針對代理程式設計、工具使用及協同。安提克觀察到 MiniMax 在發布最新 Claude 模型時,將近一半流量重定向以竊取能力。 安提克表示,這些攻擊需要先進晶片的支援,因此強化了出口管制的合理性,限制晶片存取能同時阻礙直接模型訓練與非法蒸餾的規模。Silverado Policy Accelerator 主席 Dmitri Alperovitch 指出,中國 AI 模型的快速進展部分源於對美國前沿模型的偷竊,這應成為拒絕向這些公司銷售 AI 晶片的理由。此外,安提克警告非法蒸餾的模型可能無法保留防止生物武器開發或惡意網路活動的安全防護,並可能被威權政府用於攻擊性網路操作、假訊息運動及大規模監控,構成國家安全風險。