來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
OpenAI 再度延宕開放模型的發佈時程
OpenAI 執行長 Sam Altman 於週五宣佈,公司將無限期延遲其開放模型(open model)的發布,此前該模型已於今年夏天被推遲一個月。原本計劃下週發布,但 Altman 表示需要更多時間進行額外的安全測試並審查高風險區域。他強調,一旦權重(weights)發布,便無法撤回,因此公司希望確保模型完美無缺。此次延遲是 OpenAI 夏季最受矚目的 AI 事件之一,另一項備受期待的是 ChatGPT 開發者推出的 GPT-5。與 GPT-5 不同,OpenAI 的開放模型將可供開發者免費下載並在本地執行。此次延遲意味著開發者需等待更久才能體驗 OpenAI 數年來發布的首個開放模型。TechCrunch 此前報導,該開放模型的推理能力預計與公司的 o 系列模型相似,並旨在超越其他開放模型。隨著 xAI、Google DeepMind 和 Anthropic 投入數十億美元,OpenAI 試圖證明其仍是矽谷領先的 AI 實驗室。本週開放 AI 模型生態系競爭加劇,中國 AI 起點 Moonshot AI 於週五推出了 Kimi K2,這是一個一兆引數的開放模型,在多個代理程式設計基準測試中表現優於 OpenAI 的 GPT-4.1。OpenAI 研究副總裁 Aidan Clark 表示,雖然模型能力令人驚嘆,但對開放原始碼模型的標準很高,需要更多時間確保在每個維度上都值得驕傲。此外,OpenAI 領導層曾討論讓開放模型連線至公司雲端託管的 AI 模型以處理複雜查詢,但這些功能是否會出現在最終版本中尚不明確。
-
風帆運動會CEO加入Google;OpenAI收購案告吹
OpenAI 以 30 億美元收購熱門 AI 編碼起點公司 Windsurf 的交易於週五告吹。令人驚訝的是,Google DeepMind 正在招聘 Windsurf 的執行長 Varun Mohan、共同創辦人 Douglas Chen 以及部分頂尖研究人員。Google 發言人確認了這一招聘行動,並表示 Google 並未取得 Windsurf 的股權,也不會對公司擁有控制權。作為交易的一部分,Google 將獲得 Windsurf 部分技術的非獨家授權,這意味著該起點公司仍可將技術授權給其他方。彭博社報導,Google 支付 24 億美元以獲取技術授權並聘用頂尖員工。Google 發言人 Chris Pappas 表示,歡迎這些頂尖 AI 編碼人才加入,以推進其代理編碼工作。此交易代表了 AI 生態系統中最新的「反向收購」案例,即公司聘用起點公司的頂尖人才並授權技術,但並未直接收購公司。Google 此前曾以類似方式聘回 Character.AI 執行長 Noam Shazeer,Microsoft 也曾聘請 Mustafa Suleyman。這些交易幫助各大科技公司在 AI 競賽中提升地位,同時避免監管審查。Windsurf 執行長 Mohan 和 Chen 表示,他們為過去四年所建立的成果感到自豪,並期待與世界級團隊一起啟動下一個階段。截至週五,Windsurf 業務負責人 Jeff Wang 將擔任臨時執行長。Windsurf 約 250 人的團隊中,大部分將繼續為企業客戶提供 AI 編碼工具。Windsurf 在 4 月的年度可重複收入(ARR)達到約 1 億美元,從數月前約 4000 萬美元大幅增長,這吸引了 OpenAI 和 Google 等競逐者。此交易可能對 Windsurf 造成類似 Scale AI 與 Meta 合作後流失客戶,或 Inflection 與 Microsoft 合作後被迫轉向消費端 AI 的負面影響。
-
AI程式設計工具未必能提升所有開發者的效率,研究顯示
近年軟體工程師的工作流程因 Cursor 與 GitHub Copilot 等 AI 編碼工具的湧入而發生轉變,這些工具宣稱能透過自動編寫程式碼、修復錯誤及測試變更來提升生產力,其背後的 AI 模型來自 OpenAI、Google DeepMind、Anthropic 和 xAI。然而,非營利 AI 研究組織 METR 於週四發表的新研究對這些工具是否能真正提升資深開發者的生產力提出質疑。METR 招募了 16 位資深開源開發者,讓他們在常貢獻的大型程式碼庫中完成 246 個真實任務,並隨機分配一半任務允許使用 Cursor Pro 等 AI 工具,另一半則禁止使用。開發者事前預測使用 AI 工具可縮短 24% 的完成時間,但結果顯示允許使用 AI 反而使完成時間增加了 19%,開發者在使用 AI 工具時變慢了。值得注意的是,僅有 56% 的開發者有使用 Cursor 的經驗,雖然 94% 的開發者有使用網頁式大語言模型的經驗,但本研究是首次測試 Cursor 的特定應用。研究人員指出,開發者雖接受過 Cursor 訓練,但使用 AI 時花費大量時間在提示和等待回應,且 AI 在大型複雜程式碼庫中表現不佳。儘管 METR 的研究者謹慎表示不認為當前 AI 系統無法加速大多數開發者,且預期未來三個月內情況可能改善,但研究結果仍讓人對 2025 年宣稱的普遍生產力提升保持懷疑。此外,其他研究也顯示當前 AI 編碼工具可能引入錯誤甚至安全漏洞。
-
Hugging Face 新推出的機器人被譽為 AI 裝置界的辛普森
Hugging Face 於本週推出了全新的程式化 Reachy Mini 機器人,這些 AI 機器人採用開源方案並由 Raspberry Pi 驅動,外觀設計帶有卡通天線與大圓眼。雖然這些機器人在開箱後功能有限,但這正是其設計理念所在。在 TechCrunch 的 Equity 播客節目中,主持人 Kirsten Korosec、Max Zeff 和 Anthony Ha 深入探討了 Reachy Mini 的發售情況,該產品在首二十四小時內便取得了令人驚訝的五十萬美元銷售額。隨著像 Hugging Face 這樣的開源公司開始探索實體產品,Kirsten 和 Max 認為 Reachy Mini 可能成為 AI 硬體版的《賽爾迪》,儘管機器人本身可能無法完成特定任務,但其吸引力依然強大。本期播客還涵蓋了其他週間新聞,包括 Grok 的活躍週期以及 Linda Yaccarino 突然離開 X 平臺的事宜。此外,Rivian 的微型移動性子公司 Also 在尚未推出產品的情況下,又獲得了兩億美元融資用於生產電動腳踏車。據報 LangChain 完成了一輪新融資,估值將推升至十億美元,這部分歸功於其轉向開發者工具商業化的戰略調整。Equity 是 TechCrunch 的旗艦播客,由 Theresa Loconsolo 製作,每週三和週五更新。讀者可透過 Apple Podcasts、Overcast、Spotify 等平臺訂閱,並關注其 X 和 Threads 帳號 @EquityPod。