文章

所有發布的 AI 新聞與論文。

依日期: 最新優先最舊優先

Meta因AI智能眼鏡的隱私問題被訴，員工曾審閱裸露、性愛及其他視頻內容

2026年3月5日

Meta 因 AI 智慧眼鏡的隱私問題面臨新的集體訴訟。瑞典報紙調查發現，一家位於肯亞的分包商員工正在審查使用者眼鏡拍攝的影片，內容包含裸露、性行為及如廁等敏感畫面。雖然 Meta 聲稱已對影像進行模糊處理，但來源指出該功能並未一致運作。此訊息促使英國資訊事務辦公室展開調查，同時美國也提起訴訟。原告吉娜·巴特諾和馬特奧·卡努委託克拉克森律師事務所，指控 Meta 違反隱私法並進行虛假宣傳。原告指出，Meta 宣稱其眼鏡「為隱私設計」、「由您掌控」，但實際上海外員工可檢視使用者私密內容，且無明確免責宣告。訴訟將 Meta 及其製造夥伴 Luxottica 美國公司列為被告，指責其違反消費者保護法。克拉克森律師事務所曾對 Apple、Google 及 OpenAI 提起重大訴訟，並指出問題規模巨大。2025 年超過七百萬使用者購買了 Meta 智慧眼鏡，其拍攝內容被送入資料管道供審查，使用者無法選擇退出。Meta 向 BBC 表示，為提升體驗會使用合約商審查使用者分享給 Meta AI 的內容，並援引其隱私政策與補充服務條款，但具體位置未明確說明。英國及美國版本的服務條款均提及人工審查可能。原告提供的廣告顯示，Meta 強呼叫戶對資料和內容的掌控權，並宣稱增加了安全層級。隨著智慧眼鏡等「豪華監控」技術興起，社會反彈強烈，甚至有開發者推出檢測眼鏡位置的應用程式。Meta 發言人克里斯托弗·斯格羅表示，除非使用者主動分享，否則媒體檔案保留在使用者裝置上；若分享給 Meta AI，有時會使用合約商審查以改善體驗，並採取過濾措施保護隱私。
Cursor 即將推出一種新型的代理編程工具

2026年3月5日

隨著代理程式碼化（agentic coding）的普及，軟體工程師的工作生活變得極度複雜，單一工程師可能同時監督數十個編碼代理，人類工程師的注意力迅速成為限制資源。Cursor 於三月五日推出名為 Automations 的新工具，旨在應對這種混亂。該系統允許使用者根據程式碼庫新增、Slack 訊息或簡單計時器自動啟動代理，讓工程師無需同時追蹤大量代理，即可審查和維護由代理工具產生的新程式碼。這打破了大多數代理工程依賴「提示與監控」的動態，讓工程師從主動啟動改為在適當時機被呼叫介入。Cursor 工程主管 Jonas Nelle 表示，人類並非完全缺席，而是不再總是發起者，而是在必要時被調動。早期範例 Bugbot 是 Cursor 的長期功能，每次工程師修改程式碼時都會觸發以檢查錯誤。透過 Automations，Cursor 已將此係統擴充套件至更複雜的安全審查和更嚴謹的審查流程。工程負責人 Josh Ma 指出，投入更多計算資源尋找難解問題非常有價值。Cursor 估計每小時執行數百個自動化流程，範圍遠超簡單程式碼審查，還用於事故回應，例如透過 PagerDuty 事故觸發代理查詢伺服器日誌，並提供每週程式碼變更摘要。Cursor 認為自動化改變了模型在程式碼庫中有用的任務型別。 Cursor 面臨激烈競爭，OpenAI 和 Anthropic 近期也更新了代理編碼工具。資料顯示 Cursor 市場份額自五月以來穩固，約有 25% 的生成式 AI 客戶使用 Cursor。儘管如此，代理編碼領域的整體增長使 Cursor 營收保持驚人速度。彭博社報導，Cursor 年營收已超過 20 億美元，過去三個季度翻倍。
OpenAI 發佈 GPT-5.4 具 Pro 與 Thinking 版本

2026年3月5日

OpenAI 於週四推出了 GPT-5.4，宣稱這是其最強大且高效的專業工作前沿模型。該模型提供標準版、推理版（GPT-5.4 Thinking）以及針對高績效最佳化的版本（GPT-5.4 Pro）。API 版本的上下文視窗可達一百萬 token，遠超 OpenAI 現有產品。新模型在 token 效率上顯著提升，能以較少 token 解決相同問題，並在 OSWorld-Verified 和 WebArena Verified 等電腦使用 benchmarks 中創下紀錄。在 OpenAI 的 GDPval 知識工作任務測試中，得分高達 83%。此外，GPT-5.4 在 Mercor 的 APEX-Agents 專業技能測試（涵蓋法律與金融領域）中取得領先，Mercor 執行長 Brendan Foody 指出該模型在製作簡報、財務模型及法律分析等長期交付成果方面表現卓越，且執行速度更快、成本更低。在減少幻覺與事實錯誤方面，新模型相比 GPT 5.2 在個別宣告的錯誤率降低 33%，整體回應錯誤率降低 18%。API 版本引入了新的工具呼叫系統 Tool Search，取代了以往列出所有工具定義的方式，有效節省 token 並提升效率。同時，OpenAI 新增安全評估以測試模型的思維鏈（Chain-of-Thought），顯示在推理版中模型較少欺騙其思維過程，證明思維鏈監控仍是有效的安全工具。
Luma 發布全新「統一智能」模型驅動的創意 AI 代理

2026年3月5日

美國 AI 影片生成新創公司 Luma 於週四推出了 Luma Agents，旨在處理跨文字、影象、影片與音訊的端到端創意工作。該平臺由 Luma 的統一智慧（Unified Intelligence）模型家族驅動，其核心架構基於 Uni-1 模型，該模型是此係列中首款整合了音訊、影片、影象、語言及空間推理能力的 AI 模型。Luma 執行長兼共同創辦人 Amit Jain 表示，Uni-1 模型能夠「以語言思考、想像並渲染畫素或影象」，他將此稱為「畫素中的智慧」。 Luma Agents 被定位為廣告公司、行銷團隊、設計工作室及企業的新工作模式。該系統具備規劃與生成多媒體內容的能力，並能與包括 Luma 的 Ray 3.14、Google 的 Veo 3、Nano Banana Pro、ByteDance 的 Seedream 以及 ElevenLabs 的語音模型在內的其他 AI 模型協同運作。與傳統需要反覆提示（prompt）不同，Luma Agents 能自動生成大量變體，使用者僅需透過對話引導方向。Jain 指出，這種能力讓系統能維持跨資產、合作者及創意迭代的持續情境，並透過自我批評的迭代迴圈來評估與最佳化輸出結果。目前，Luma 已將新平臺滾動式推出給現有客戶，包括全球廣告公司 Publicis Groupe 和 Serviceplan，以及品牌 Adidas、Mazda 和沙特 AI 公司 Humain。Jain 舉例說明，系統曾將一個 200 字的簡報與一支口紅產品的圖片，轉化為廣告活動的各種地點、模特兒與配色方案概念。另一項示範中，Luma Agents 在 40 小時內將某品牌的 1500 萬美元年度廣告活動轉化為多個國家的本地化廣告，且費用低於 20,000 美元，並透過了品牌內部品質與準確性檢查。雖然 Luma Agents 目前透過 API 公開可用，但 Luma 計劃逐步開放訪問許可權，以確保使用者獲得可靠的服務並避免工作流程中斷。

文章

Meta因AI智能眼鏡的隱私問題被訴，員工曾審閱裸露、性愛及其他視頻內容

Cursor 即將推出一種新型的代理編程工具

OpenAI 發佈 GPT-5.4 具 Pro 與 Thinking 版本

Luma 發布全新「統一智能」模型驅動的創意 AI 代理