文章
所有發布的 AI 新聞與論文。
-
米拉·穆拉蒂的思考機器實驗室在種子輪籌資中價值120億美元
Thinking Machines Lab 是由前 OpenAI 技術長 Mira Murati 創立的 AI 新創公司,於週一正式完成由 Andreessen Horowitz 主導的 20 億美元種子輪融資。此次交易還包括 Nvidia、Accel、ServiceNow、CISCO、AMD 和 Jane Street 等機構的參與,將公司估值推高至 120 億美元。儘管此前有報導稱該公司接近以 100 億美元估值完成此輪融資,但實際估值在過去一個月內大幅上漲。此筆交易被視為矽谷歷史上規模最大的種子輪或首輪融資之一,反映了投資者對新興 AI 實驗室的高度熱情。 Thinking Machines Lab 成立不到一年,尚未公佈具體研發專案。Murati 在 X 平臺透露,公司計劃在未來幾個月內推出產品,並包含重要的開源方案,旨在協助研究人員和開發自定義 AI 模型的創業公司。Murati 表示,公司將分享最佳科學成果,幫助研究社群更好地理解前沿 AI 系統。該公司使命是透過推進協作通用智慧來賦能人類,開發能與人類自然互動的多模態 AI。 Murati 表示公司正在招聘具有從零構建成功 AI 產品經驗的人才。Meta 曾於近期與 Thinking Machines Lab 洽談收購事宜,但尚未達成最終報價。該公司被視為對 OpenAI、Anthropic 和 Google DeepMind 等領先 AI 開發者的潛在威脅。儘管面臨 Meta、Google DeepMind、Anthropic 和 OpenAI 等巨頭投入數十億美元研發團隊的競爭壓力,Thinking Machines Lab 仍可能憑藉新型研究突破來建立差異化優勢。此前,該公司已與 Google Cloud 達成協議,由其提供 AI 模型運算能力。
-
Google Discover 加入 AI 總結功能,威脅出版社將面臨更多流量下降
Google 正在其 iOS 和 Android 搜尋應用程式的 Discover 主要新聞資訊流中推出 AI 摘要功能,以應對出版商擔憂的流量下降問題。此功能允許使用者在閱讀主要媒體的標題前,先看到多個新聞出版商的標誌,隨後閱讀由 AI 生成的摘要,該摘要會引用相關來源。Google 明確警告使用者,這些摘要是由 AI 生成且可能出現錯誤。目前該功能僅在美國地區推出,初期專注於體育、娛樂等熱門生活主題,並旨在幫助使用者更輕鬆地決定瀏覽哪些頁面。除了 AI 摘要,Google 還在 Discover 中測試其他新聞呈現方式,例如在標題下方加入摘要要點,或將相關新聞(如關於特朗普與烏克蘭協議的故事)進行分組連結。儘管許多出版商如《華爾街日報》、Yahoo、彭博社等已自行嘗試在網站上使用 AI,但業界對 AI 對網站流量和轉介的影響仍存顯著擔憂。資料顯示,自 2024 年 5 月 AI Overviews 推出以來,導致無點選轉發的新聞搜尋比例從 56% 上升至 2025 年 5 月的近 69%。全球搜尋流量在 2024 年 6 月同比下跌 15%,有機流量則從 2024 年中期的 23 億次訪問降至 17 億次以下。面對此趨勢,Google 推出了 Offerwall 功能,讓出版商透過微支付、調查或觀看廣告等方式獲取收入,但許多出版商認為這些工具來得太晚,無法抵禦持續下滑的流量。
-
AI程式碼工具正轉向一個驚人的領域:終端機
近年來,Cursor、Windsurf 及 GitHub Copilot 等程式碼編輯工具一直是 AI 軟體開發的標準,但隨著代理式 AI 的興起與 Vibe Coding 的流行,AI 與軟體的互動方式正發生微妙轉變。AI 不再僅限於編輯程式碼,而是越來越多地直接與系統終端(Terminal)互動。自二月以來,Anthropic、DeepMind 和 OpenAI 分別推出了終端編碼工具 Claude Code、Gemini CLI 和 CLI Codex,這些產品已成為公司最熱門的產品之一。儘管品牌外觀相似,但其底層互動方式已發生實質變化。 知名終端評估指標 Terminal-Bench 的共同創作者 Mike Merrill 表示,未來 95% 的 LLM 與電腦互動將透過類終端介面進行。隨著傳統程式碼編輯工具面臨挑戰,例如 Windsurf 因併購糾紛導致未來不確定,且 METR 研究顯示開發者對 Cursor Pro 等工具的效率提升估計(20% 至 30%)與實際觀察(近 20% 變慢)存在落差,這為終端工具帶來了機會。目前 Warp 在 Terminal-Bench 中排名第一,其創辦人 Zach Lloyd 認為終端位於開發者棧的低層,是最具靈活性執行代理式 AI 的地方。 與專注於解決 GitHub 問題(SWE-Bench)的程式碼生成工具不同,終端工具採取更廣泛的視角,涵蓋 DevOps 任務如配置 Git 伺服器或排查指令碼無法執行的問題。Terminal-Bench 的挑戰不僅在於問題本身,更在於環境,要求 AI 具備逐步解決問題的代理式能力。儘管目前 Warp 僅解決了超過一半的問題,顯示該指標極具挑戰性,但 Lloyd 相信終端工具已能可靠處理開發者大部分非編碼工作,例如自主設定專案依賴並使其可執行,若無法完成則會告知原因。
-
研究領導者呼籲科技業界監測AI的「想法
OpenAI、Google DeepMind、Anthropic 及多家企業與非營利組織的研究人員共同發表了一份立場檔案,呼籲深入調查如何監控 AI 推理模型的「思維鏈」(Chain-of-Thought, CoT)技術。AI 推理模型如 OpenAI 的 o3 和 DeepSeek 的 R1,其核心特徵在於類似人類使用草稿紙解題的外部化思考過程。作者認為,監控這些思維鏈是控制日益普及且強大的 AI 代理的關鍵方法,能為前沿 AI 的安全措施提供珍貴的決策洞察。然而,研究人員也警告,目前的透明度可能無法持久,並呼籲開發者研究如何維持這種可監控性,避免任何可能降低透明度的幹預。 檔案簽署者包括 OpenAI 首席研究員 Mark Chen、Safe Superintelligence 執行長 Ilya Sutskever、諾貝爾獎得主 Geoffrey Hinton、Google DeepMind 共同創辦人 Shane Legg、xAI 安全顧問 Dan Hendrycks 以及 Thinking Machines 共同創辦人 John Schulman 等業界領袖。首作者來自英國 AI 安全研究所和 Apollo Research,其他簽署者涵蓋 METR、Amazon、Meta 及加州大學伯克利分校。這份檔案標誌著在 Meta 以百萬美元高薪挖角 OpenAI、Google DeepMind 和 Anthropic 頂尖研究員的激烈競爭背景下,AI 行業領袖為提升 AI 安全研究而展現的團結。 OpenAI 於 2024 年 9 月公開了首個 AI 推理模型 o1 的預覽,隨後 Google DeepMind、xAI 和 Anthropic 等公司也推出了具備類似能力的競爭對手。儘管 AI 效能在過去一年大幅提升,但業界對其內部運作機制仍知之甚少。Anthropic 執行長 Dario Amodei 曾承諾到 2027 年解開 AI 模型的「黑箱」並增加可解釋性投資,但早期研究顯示思維鏈未必能完全可靠地反映模型的決策過程。OpenAI 研究人員則認為思維鏈監控未來可能成為追蹤對齊與安全的有效方式。這份立場檔案旨在為這一新興研究領域提供訊號並吸引關注,以確保在技術快速演變中維持安全與透明。