語言: 英文
英文 的 AI 新聞與論文。
-
Google 雲端 AI 首席談模型能力的三大領域
Google Cloud 產品副總裁 Michael Gerstenhaber 主要負責 Vertex AI,這是公司統一的企業級 AI 部署平臺。他在訪談中提出,AI 模型正同時面臨三大前沿挑戰:原始智慧、回應速度以及與成本密切相關的第三個維度,即模型能否以低廉成本在巨大且不可預測的規模下執行。他強調,這是一種重新定義模型能力的新思維方式。Gerstenhaber 在 AI 領域工作約兩年,此前曾在 Anthropic 工作一年半,現於 Google 工作近半年。他負責的 Vertex AI 平臺主要服務工程師,提供代理模式、代理平臺以及全球最強大模型的推理能力,而具體應用則由 Shopify、Thomson Reuters 等客戶自行開發。他認為 Google 的獨特優勢在於垂直整合,從介面到基礎設施層(包括資料中心、電力、晶片、模型、推理層、代理層、API 及合規治理)均自掌控,這使其成為推動前沿模型的理想場所。 Gerstenhaber 指出,目前三大科技巨頭的能力差距不大,但競爭不僅僅是追求更高智慧,還涉及複雜的平衡。第一 frontier 是原始智慧,例如編寫程式碼時追求最佳結果,即使耗時 45 分鐘亦可接受;第二 frontier 是延遲,在客戶服務場景中,若回答過於遲緩導致客戶結束通話,再高的智慧也無意義,需在延遲預算內提供最智慧的產品;第三 frontier 是成本與規模,如 Reddit 或 Meta 需要處理海量內容審核,必須在預算限制下以可擴充套件的方式執行高智慧模型。他解釋代理系統普及緩慢的原因在於基礎設施缺失,缺乏審計代理行為和資料授權的模式,且生產環境總是滯後於技術能力。相比之下,Google 因具備軟體開發生命週期中的安全開發環境、雙重審計機制及人工介入流程,能極低風險地將技術落地,但也需其他領域複製這些模式。
-
OpenAI 請來顧問協助推動企業發展計畫
OpenAI 於本週一宣佈與四家大型諮詢公司建立「邊界聯盟」(Frontier Alliances),旨在透過多年度合作推動企業業務在 2026 年的增長。這些合作夥伴包括波士頓諮詢集團(BCG)、麥肯錫、安永(Accenture)和 Capgemini。OpenAI 的向前部署工程團隊將與這些諮詢巨頭合作,協助他們將 OpenAI Frontier 等企業級技術整合到客戶的技術架構中。OpenAI Frontier 是一款於二月初推出的無程式碼開放軟體,允許使用者構建、部署和管理基於 OpenAI 模型及更廣泛技術的 AI 代理。 BCG 執行長克里斯托夫·施魏策爾表示,僅有 AI 無法驅動轉型,必須將其與戰略連結,並重新設計流程,在對齊激勵措施和文化的基礎上實現規模化採用,才能帶來持續的成果。OpenAI 的聯盟策略不僅是向企業推廣將 AI 融入現有工作流,更著重於透過諮詢師說服企業改變戰略和工作流程,以在合適的時機整合 OpenAI 工具。目前企業對 AI 的採用速度相對緩慢,主要因難以從 AI 專案中獲得有意義的投資回報。值得注意的是,OpenAI 的競爭對手 Anthropic 近期也與德勤和安永等諮詢公司簽署了協議。OpenAI 財務長莎拉·弗瑞爾在一月發表的部落格文章中指出,企業市場是 OpenAI 在 2026 年的重點關注領域。此外,OpenAI 今年已與 Snowflake 和 ServiceNow 簽署了大型企業 AI 協議,並於一月任命巴雷特·佐普(Barret Zoph)領導公司的企業銷售工作。
-
Guide Labs 發表一種新型可解釋的 LLM
Guide Labs 是一家由 CEO Julius Adebayo 和首席科學官 Aya Abdelsalam Ismail 於 2024 年 11 月從 Y Combinator 孵化並獲得 Initialized Capital 900 萬美元種子輪融資的舊金山創業公司,旨在解決深度學習模型難以解釋的挑戰。該公司今日公開了名為 Steerling-8B 的 80 億引數大型語言模型,該模型採用新架構設計,使其行為具有高度可解釋性。在該架構下,模型產生的每個 token 都能追溯至訓練資料的來源,這使得確定模型引用事實的參考資料或理解其對幽默、性別等概念的認知變得可行。Adebayo 指出,雖然現有模型也能做到,但這種方法非常脆弱,而 Steerling-8B 透過在模型中插入概念層將資料分組為可追蹤類別,將可解釋性從神經科學問題轉變為工程問題。儘管這種方法需要額外的資料標註,但團隊利用其他 AI 模型協助訓練,成功證明瞭其可行性。Adebayo 表示,該模型能達到現有模型 90% 的能力,但使用了更少的訓練資料,並且保留了模型自行發現概念(如量子計算)的突發行為。對於消費級 LLM、受監管行業(如金融)以及科學研究(如蛋白質摺疊),這種可解釋性至關重要,有助於控制版權內容、暴力或藥物濫用等輸出,並讓模型在評估貸款申請時考慮財務記錄而非種族。Guide Labs 的下一步是構建更大規模的模型,並開始向使用者提供 API 和智慧體訪問服務,以實現可解釋性的民主化。
-
Particle 的 AI 資訊 App 聽播客尋找有趣片段,讓你不用自己尋找
前 Twitter 工程師團隊開發的 AI 新聞應用程式 Particle,近期在推出 Android 版本前,新增了名為 Podcast Clips 的功能。該功能能自動搜尋並篩選多個播客中與新聞故事最相關且有趣的片段,將這些短影音直接整合進新聞資訊流中。使用者不再需要完整聆聽冗長的播客節目,即可在閱讀新聞時直接播放約 45 秒的關鍵評論,或選擇閱讀帶有高亮顯示的逐字稿。Particle 執行長 Sara Beykpour 表示,此功能旨在讓使用者在閱讀新聞時,能迅速掌握大眾對該議題的評論與觀點。 此功能反映了新聞生態系的轉變,播客不僅成為可靠的新聞來源,更成為重大公告的發布平臺。許多科技執行長甚至轉向與友善的播客主持人合作,而非傳統媒體。Particle 利用嵌入模型(embedding models)來識別播客內容與新聞故事的關聯,這些模型由提供大型語言模型(LLM)的同一家公司提供,但並非生成式 AI。公司還使用 ElevenLabs 的技術進行轉錄,而精確剪輯音訊的邏輯則為 Particle 的獨有技術。 除了 Podcast Clips,Particle 也推出了名為 Particle+ 的付費訂閱服務,月費為 2.99 美元或年費 29.99 美元,提供自然語言摘要、多語音選擇、無限制字謎遊戲及 AI 聊天機器人等高階功能。Android 版本還擴充了瀏覽標籤,新增 2026 年冬季奧運等時事內容,並最佳化實體頁面以顯示定義、相關文章與主題。目前 Particle 的國際使用者佔比達 55%,印度為第二大市場,佔比 15%。