來源類型: 新聞
「新聞」來源類型(news=新聞 / paper=論文 / blog)的 AI 內容。
-
OpenAI 發佈 GPT-5.4 具 Pro 與 Thinking 版本
OpenAI 於週四推出了 GPT-5.4,宣稱這是其最強大且高效的專業工作前沿模型。該模型提供標準版、推理版(GPT-5.4 Thinking)以及針對高績效最佳化的版本(GPT-5.4 Pro)。API 版本的上下文視窗可達一百萬 token,遠超 OpenAI 現有產品。新模型在 token 效率上顯著提升,能以較少 token 解決相同問題,並在 OSWorld-Verified 和 WebArena Verified 等電腦使用 benchmarks 中創下紀錄。在 OpenAI 的 GDPval 知識工作任務測試中,得分高達 83%。此外,GPT-5.4 在 Mercor 的 APEX-Agents 專業技能測試(涵蓋法律與金融領域)中取得領先,Mercor 執行長 Brendan Foody 指出該模型在製作簡報、財務模型及法律分析等長期交付成果方面表現卓越,且執行速度更快、成本更低。 在減少幻覺與事實錯誤方面,新模型相比 GPT 5.2 在個別宣告的錯誤率降低 33%,整體回應錯誤率降低 18%。API 版本引入了新的工具呼叫系統 Tool Search,取代了以往列出所有工具定義的方式,有效節省 token 並提升效率。同時,OpenAI 新增安全評估以測試模型的思維鏈(Chain-of-Thought),顯示在推理版中模型較少欺騙其思維過程,證明思維鏈監控仍是有效的安全工具。
-
Cursor 即將推出一種新型的代理編程工具
隨著代理程式碼化(agentic coding)的普及,軟體工程師的工作生活變得極度複雜,單一工程師可能同時監督數十個編碼代理,人類工程師的注意力迅速成為限制資源。Cursor 於三月五日推出名為 Automations 的新工具,旨在應對這種混亂。該系統允許使用者根據程式碼庫新增、Slack 訊息或簡單計時器自動啟動代理,讓工程師無需同時追蹤大量代理,即可審查和維護由代理工具產生的新程式碼。這打破了大多數代理工程依賴「提示與監控」的動態,讓工程師從主動啟動改為在適當時機被呼叫介入。Cursor 工程主管 Jonas Nelle 表示,人類並非完全缺席,而是不再總是發起者,而是在必要時被調動。 早期範例 Bugbot 是 Cursor 的長期功能,每次工程師修改程式碼時都會觸發以檢查錯誤。透過 Automations,Cursor 已將此係統擴充套件至更複雜的安全審查和更嚴謹的審查流程。工程負責人 Josh Ma 指出,投入更多計算資源尋找難解問題非常有價值。Cursor 估計每小時執行數百個自動化流程,範圍遠超簡單程式碼審查,還用於事故回應,例如透過 PagerDuty 事故觸發代理查詢伺服器日誌,並提供每週程式碼變更摘要。Cursor 認為自動化改變了模型在程式碼庫中有用的任務型別。 Cursor 面臨激烈競爭,OpenAI 和 Anthropic 近期也更新了代理編碼工具。資料顯示 Cursor 市場份額自五月以來穩固,約有 25% 的生成式 AI 客戶使用 Cursor。儘管如此,代理編碼領域的整體增長使 Cursor 營收保持驚人速度。彭博社報導,Cursor 年營收已超過 20 億美元,過去三個季度翻倍。
-
Meta因AI智能眼鏡的隱私問題被訴,員工曾審閱裸露、性愛及其他視頻內容
Meta 因 AI 智慧眼鏡的隱私問題面臨新的集體訴訟。瑞典報紙調查發現,一家位於肯亞的分包商員工正在審查使用者眼鏡拍攝的影片,內容包含裸露、性行為及如廁等敏感畫面。雖然 Meta 聲稱已對影像進行模糊處理,但來源指出該功能並未一致運作。此訊息促使英國資訊事務辦公室展開調查,同時美國也提起訴訟。原告吉娜·巴特諾和馬特奧·卡努委託克拉克森律師事務所,指控 Meta 違反隱私法並進行虛假宣傳。原告指出,Meta 宣稱其眼鏡「為隱私設計」、「由您掌控」,但實際上海外員工可檢視使用者私密內容,且無明確免責宣告。訴訟將 Meta 及其製造夥伴 Luxottica 美國公司列為被告,指責其違反消費者保護法。克拉克森律師事務所曾對 Apple、Google 及 OpenAI 提起重大訴訟,並指出問題規模巨大。2025 年超過七百萬使用者購買了 Meta 智慧眼鏡,其拍攝內容被送入資料管道供審查,使用者無法選擇退出。Meta 向 BBC 表示,為提升體驗會使用合約商審查使用者分享給 Meta AI 的內容,並援引其隱私政策與補充服務條款,但具體位置未明確說明。英國及美國版本的服務條款均提及人工審查可能。原告提供的廣告顯示,Meta 強呼叫戶對資料和內容的掌控權,並宣稱增加了安全層級。隨著智慧眼鏡等「豪華監控」技術興起,社會反彈強烈,甚至有開發者推出檢測眼鏡位置的應用程式。Meta 發言人克里斯托弗·斯格羅表示,除非使用者主動分享,否則媒體檔案保留在使用者裝置上;若分享給 Meta AI,有時會使用合約商審查以改善體驗,並採取過濾措施保護隱私。
-
Anthropic CEO Dario Amodei 可能仍在與五角大樓談判合作計畫
安提克(Anthropic)與美國國防部(DOD)價值兩億美元的合約於上週破裂,雙方無法就軍隊獲取安提克 AI 技術的無限制程度達成協議。當國防部轉向與 OpenAI 達成交易時,外界預期安提克與五角大樓的關係將終結,但《金融時報》與彭博社報導顯示,前 OpenAI 創辦人埃米爾·阿莫迪(Elon Musk 的同事,文中誤植為 Amodei,實指 Dario Amodei)已與五角大樓官員埃米爾·米歇爾(Emil Michael)恢復談判。這些談話旨在妥協一份關於五角大樓如何繼續訪問安提克 AI 模型的合約。儘管雙方已爆發激烈爭執,但妥協對雙方面臨的衝擊仍具吸引力,因為五角大樓目前依賴安提克技術, abrupt 轉向 OpenAI 系統將造成混亂。爭端始於安提克執行長達裡奧·阿莫迪(Dario Amodei)對合約條款中允許軍隊將 AI 用於「任何合法用途」表示擔憂。阿莫迪聲稱公司禁止技術用於國內大規模監控或自主武器,並要求合約明確禁止這些用途。當安提克拒絕配合時,國防部轉向與 OpenAI 簽約。隨後,雙方人物公開表達不滿,米歇爾稱阿莫迪為「騙子」並擁有「神格」,而阿莫迪則在致安提克員工的信中批評 OpenAI 的合約是「安全劇場」,稱其相關訊息為「赤裸裸的謊言」。阿莫迪指出,OpenAI 接受合約是為了安撫員工,而安提克則致力於防止濫用。國防部長皮特·海格塞斯(Pete Hegseth)已承諾將安提克列為「供應鏈風險」,本質上將其列入與任何與美國軍事業務相關公司的合作名單,儘管他尚未採取法律行動。此類指定通常保留給外國敵對勢力,其能否透過法院挑戰尚不清楚。