文章
所有發布的 AI 新聞與論文。
-
Meta因AI智能眼鏡的隱私問題被訴,員工曾審閱裸露、性愛及其他視頻內容
Meta 因 AI 智慧眼鏡的隱私問題面臨新的集體訴訟。瑞典報紙調查發現,一家位於肯亞的分包商員工正在審查使用者眼鏡拍攝的影片,內容包含裸露、性行為及如廁等敏感畫面。雖然 Meta 聲稱已對影像進行模糊處理,但來源指出該功能並未一致運作。此訊息促使英國資訊事務辦公室展開調查,同時美國也提起訴訟。原告吉娜·巴特諾和馬特奧·卡努委託克拉克森律師事務所,指控 Meta 違反隱私法並進行虛假宣傳。原告指出,Meta 宣稱其眼鏡「為隱私設計」、「由您掌控」,但實際上海外員工可檢視使用者私密內容,且無明確免責宣告。訴訟將 Meta 及其製造夥伴 Luxottica 美國公司列為被告,指責其違反消費者保護法。克拉克森律師事務所曾對 Apple、Google 及 OpenAI 提起重大訴訟,並指出問題規模巨大。2025 年超過七百萬使用者購買了 Meta 智慧眼鏡,其拍攝內容被送入資料管道供審查,使用者無法選擇退出。Meta 向 BBC 表示,為提升體驗會使用合約商審查使用者分享給 Meta AI 的內容,並援引其隱私政策與補充服務條款,但具體位置未明確說明。英國及美國版本的服務條款均提及人工審查可能。原告提供的廣告顯示,Meta 強呼叫戶對資料和內容的掌控權,並宣稱增加了安全層級。隨著智慧眼鏡等「豪華監控」技術興起,社會反彈強烈,甚至有開發者推出檢測眼鏡位置的應用程式。Meta 發言人克里斯托弗·斯格羅表示,除非使用者主動分享,否則媒體檔案保留在使用者裝置上;若分享給 Meta AI,有時會使用合約商審查以改善體驗,並採取過濾措施保護隱私。
-
Cursor 即將推出一種新型的代理編程工具
隨著代理程式碼化(agentic coding)的普及,軟體工程師的工作生活變得極度複雜,單一工程師可能同時監督數十個編碼代理,人類工程師的注意力迅速成為限制資源。Cursor 於三月五日推出名為 Automations 的新工具,旨在應對這種混亂。該系統允許使用者根據程式碼庫新增、Slack 訊息或簡單計時器自動啟動代理,讓工程師無需同時追蹤大量代理,即可審查和維護由代理工具產生的新程式碼。這打破了大多數代理工程依賴「提示與監控」的動態,讓工程師從主動啟動改為在適當時機被呼叫介入。Cursor 工程主管 Jonas Nelle 表示,人類並非完全缺席,而是不再總是發起者,而是在必要時被調動。 早期範例 Bugbot 是 Cursor 的長期功能,每次工程師修改程式碼時都會觸發以檢查錯誤。透過 Automations,Cursor 已將此係統擴充套件至更複雜的安全審查和更嚴謹的審查流程。工程負責人 Josh Ma 指出,投入更多計算資源尋找難解問題非常有價值。Cursor 估計每小時執行數百個自動化流程,範圍遠超簡單程式碼審查,還用於事故回應,例如透過 PagerDuty 事故觸發代理查詢伺服器日誌,並提供每週程式碼變更摘要。Cursor 認為自動化改變了模型在程式碼庫中有用的任務型別。 Cursor 面臨激烈競爭,OpenAI 和 Anthropic 近期也更新了代理編碼工具。資料顯示 Cursor 市場份額自五月以來穩固,約有 25% 的生成式 AI 客戶使用 Cursor。儘管如此,代理編碼領域的整體增長使 Cursor 營收保持驚人速度。彭博社報導,Cursor 年營收已超過 20 億美元,過去三個季度翻倍。
-
OpenAI 發佈 GPT-5.4 具 Pro 與 Thinking 版本
OpenAI 於週四推出了 GPT-5.4,宣稱這是其最強大且高效的專業工作前沿模型。該模型提供標準版、推理版(GPT-5.4 Thinking)以及針對高績效最佳化的版本(GPT-5.4 Pro)。API 版本的上下文視窗可達一百萬 token,遠超 OpenAI 現有產品。新模型在 token 效率上顯著提升,能以較少 token 解決相同問題,並在 OSWorld-Verified 和 WebArena Verified 等電腦使用 benchmarks 中創下紀錄。在 OpenAI 的 GDPval 知識工作任務測試中,得分高達 83%。此外,GPT-5.4 在 Mercor 的 APEX-Agents 專業技能測試(涵蓋法律與金融領域)中取得領先,Mercor 執行長 Brendan Foody 指出該模型在製作簡報、財務模型及法律分析等長期交付成果方面表現卓越,且執行速度更快、成本更低。 在減少幻覺與事實錯誤方面,新模型相比 GPT 5.2 在個別宣告的錯誤率降低 33%,整體回應錯誤率降低 18%。API 版本引入了新的工具呼叫系統 Tool Search,取代了以往列出所有工具定義的方式,有效節省 token 並提升效率。同時,OpenAI 新增安全評估以測試模型的思維鏈(Chain-of-Thought),顯示在推理版中模型較少欺騙其思維過程,證明思維鏈監控仍是有效的安全工具。
-
Luma 發布全新「統一智能」模型驅動的創意 AI 代理
美國 AI 影片生成新創公司 Luma 於週四推出了 Luma Agents,旨在處理跨文字、影象、影片與音訊的端到端創意工作。該平臺由 Luma 的統一智慧(Unified Intelligence)模型家族驅動,其核心架構基於 Uni-1 模型,該模型是此係列中首款整合了音訊、影片、影象、語言及空間推理能力的 AI 模型。Luma 執行長兼共同創辦人 Amit Jain 表示,Uni-1 模型能夠「以語言思考、想像並渲染畫素或影象」,他將此稱為「畫素中的智慧」。 Luma Agents 被定位為廣告公司、行銷團隊、設計工作室及企業的新工作模式。該系統具備規劃與生成多媒體內容的能力,並能與包括 Luma 的 Ray 3.14、Google 的 Veo 3、Nano Banana Pro、ByteDance 的 Seedream 以及 ElevenLabs 的語音模型在內的其他 AI 模型協同運作。與傳統需要反覆提示(prompt)不同,Luma Agents 能自動生成大量變體,使用者僅需透過對話引導方向。Jain 指出,這種能力讓系統能維持跨資產、合作者及創意迭代的持續情境,並透過自我批評的迭代迴圈來評估與最佳化輸出結果。 目前,Luma 已將新平臺滾動式推出給現有客戶,包括全球廣告公司 Publicis Groupe 和 Serviceplan,以及品牌 Adidas、Mazda 和沙特 AI 公司 Humain。Jain 舉例說明,系統曾將一個 200 字的簡報與一支口紅產品的圖片,轉化為廣告活動的各種地點、模特兒與配色方案概念。另一項示範中,Luma Agents 在 40 小時內將某品牌的 1500 萬美元年度廣告活動轉化為多個國家的本地化廣告,且費用低於 20,000 美元,並透過了品牌內部品質與準確性檢查。雖然 Luma Agents 目前透過 API 公開可用,但 Luma 計劃逐步開放訪問許可權,以確保使用者獲得可靠的服務並避免工作流程中斷。