文章

所有發布的 AI 新聞與論文。

依日期: 最新優先最舊優先

信心資安「AI 的信號」從隱形模式推出，獲420萬美元資金

2025年7月17日

隨著消費者、企業和政府紛紛擁抱便宜且快速的 AI 工具，資料隱私成為關鍵障礙。科技巨頭如 OpenAI、Anthropic、xAI、Google 等正悄悄收集並保留使用者資料以最佳化模型或監控安全，這在高度監管行業如醫療、金融和政府部門中可能成為採用 AI 的阻礙。基於舊金山的初創公司 Confident Security 推出產品 CONFSEC，旨在成為"AI 的 Signal"。CONFSEC 是一種端到端加密工具，可包裹基礎模型，確保提示詞和後設資料無法被儲存、檢視或用於 AI 訓練，即使對模型提供商或第三方也是如此。創辦人兼執行長 Jonathan Mortensen 表示，交出資料會降低隱私，而該產品的目標是消除這種權衡。 Confident Security 於週四以 420 萬美元種子資金退出隱形階段，投資方包括 Decibel、South Park Commons、Ex Ante 和 Swyx。公司希望作為 AI 供應商與客戶（如超規模計算服務商、政府和企業）之間的中介供應商。Mortensen 指出，AI 公司也可透過提供此工具來開發企業市場。CONFSEC 亦適合新推出的 AI 瀏覽器，如 Perplexity 最近發布的 Comet，以確保敏感資料不會被儲存於公司或惡意行為者可訪問的伺服器上，且工作相關提示詞不會被用於訓練 AI 來取代使用者工作。 CONFSEC 的架構參考了 Apple 的 Private Cloud Compute (PCC)，Mortensen 稱其在確保 Apple 無法檢視資料方面比現有解決方案好 10 倍。系統運作方式為先將資料匿名化，透過加密並路由至 Cloudflare 或 Fastly 等服務，使伺服器從未見原始內容。接著使用僅能在嚴格條件下解密的先進加密技術，例如僅允許在不記錄資料、不用於訓練且不被他人檢視的情況下解碼。最後，執行 AI 推論的軟體會公開記錄並接受審查，讓專家驗證其保證。Decibel 的合夥人 Jess Leão 表示，未來 AI 取決於基礎設施內建的信任，沒有此類解決方案，許多企業無法推進 AI 發展。這家成立一年的公司雖處早期階段，但 CONFSEC 已接受測試、外部審計並具備生產 readiness。團隊正與銀行、瀏覽器及搜尋引擎等潛在客戶洽談，以將 CONFSEC 納入其基礎設施
Mistral 的 Le Chat 聊天機器人推出新「深度研究」模式提升生產力

2025年7月17日

法國人工智慧實驗室 Mistral 於週四為其聊天機器人 Le Chat 推出了一系列新功能，使其能力更接近 OpenAI 和 Google 等競爭對手。此次更新包含全新的「深度研究」模式、原生多語言推理能力以及進階的圖片編輯功能。這是在 Mistral 數天前發布其首款開源 AI 語音模型 Voxtral 之後發生的，該模型支援多語言推理、轉錄等功能，且也可透過 Le Chat 使用。Mistral 表示，其新的深度研究模式能將 Le Chat 轉變為協同研究助理，可規劃需求、澄清疑問、搜尋並綜合資料。產品負責人 Elisa Salamanca 指出，該功能對消費者和企業使用者都極具相關性，消費者可用於規劃旅行並獲得詳盡分析，企業則可用於深入研究。這些更新適用於所有層級，包括免費、專業、團隊和企業版。Mistral 強調此次發布重點在於將 Le Chat 與其生產力套件整合進企業生態系統，這主要取決於 Mistral 處理資料聯結器的不同方式。許多擁有敏感資料的客戶（如銀行、國防和政府部門）不使用雲端服務，或僅在虛擬私人雲上執行。為此，Mistral 的 Le Chat 和生產力套件可連線企業本地資料，讓公司無需上傳資料至雲端即可分析內部資料，這與 Azure 託管的 OpenAI 和基於 Google Cloud 的 Gemini 等雲端原生大型語言模型平臺形成顯著差異。此外，Mistral 還計劃推出更多生產力工具，使其與 Microsoft Excel 和 Google Docs 等辦公套件無縫協作。除了深度研究，Le Chat 還獲得了其他更新。此前僅支援英文的複雜問題推理能力，現在已原生支援法語、西班牙語、日語等多種語言，並支援句子中切換語言。此次更新還新增了專案功能，幫助使用者將聊天、文件和想法分組到專注的空間中，每個專案可擁有獨立的預設庫並記住使用者啟用的工具和設定，適用於規劃搬家、設計新功能或追蹤工作專案。最後，Le Chat 獲得了改進的圖片編輯能力，允許使用者使用提示詞建立和編輯圖片，例如「移除物件」或「將我置於另一座城市」。這些新功能將 Mistral 置於更具競爭力的位置，使其不僅僅是模型演示，更成為全棧競爭對手。
OpenAI 發佈通用代理程式於 ChatGPT

2025年7月17日

OpenAI 於 2025 年 7 月 17 日推出全新通用目的 AI 代理 ChatGPT agent，該工具整合了 Operator 的網頁操作能力與 Deep Research 的資訊綜合能力，旨在讓使用者透過自然語言指令完成複雜的電腦任務。此功能於週四向 Pro、Plus 及 Team 訂閱者開放，使用者可在 ChatGPT 下拉選單中選擇「agent mode」以啟用。該代理具備自動瀏覽網頁、管理日曆、生成可編輯簡報與幻燈片、執行程式碼以及連線 Gmail 與 GitHub 等應用程式的能力。在效能測試方面，ChatGPT agent 模型在 Humanity's Last Exam 測試中得分為 41.6%，約為 o3 與 o4-mini 模型得分的兩倍；在 FrontierMath 數學 benchmarks 中，若具備終端機等工具輔助，其得分為 27.4%，遠高於 o4-mini 的 6.3%。由於該代理具備更強大的自主行動能力，OpenAI 將其標記為生物與化學武器領域的「高能力」模型，並啟動了即時監控系統與分類器，以攔截可能引發生物威脅的回應。此外，為防止惡意使用者透過提示注入攻擊洩漏敏感資料，OpenAI 暫時關閉了該代理的記憶功能。儘管技術表現亮眼，業界仍關注其在真實世界環境中的穩定性與安全性。
Anthropic 無預告縮減 Claude Code 使用上限

2025年7月17日

自本週一早晨起，Claude Code 使用者遭遇突發且嚴格的用量限制問題。這些問題主要集中在重度使用者身上，許多使用者訂閱的是每月 200 美元的 Max 計畫。使用者僅收到「Claude 用量限制已達上限」的提示，並被告知通常在數小時內限制將重置，但由於缺乏明確的變更公告，許多使用者推測其訂閱已被降級或用量追蹤不準確。有使用者抱怨追蹤方式改變且不再準確，指出在短短 30 分鐘內僅發出幾條請求卻觸發了 900 條訊息的限制。當被要求評論時，Anthropic 代表確認了問題但拒絕進一步說明，僅表示已知部分使用者體驗到回應速度變慢，並正在解決中。此變化令使用者感到震驚，因為他們未收到任何預先通知或未來指引。一名不願具名的使用者表示，自限制生效後無法推進專案，並嘗試過 Gemini 和 Kimi 等替代方案，但認為目前無其他產品能與 Claude Code 的能力相比。這些問題伴隨著 Anthropic 網路的廣泛問題。許多 API 使用者在同一時期報告了超載錯誤，公司狀態頁面顯示過去四天內有六個獨立問題。值得注意的是，網路在該週仍顯示 100% 的執行時間。雖然載入錯誤常見，但 Anthropic 對用量限制的新方法造成了顯著混亂。部分混亂源於其定價系統，該系統設定分級限制卻從未保證固定的訪問水平。最昂貴的 Max 計畫每月 200 美元，承諾的用量限制是 Pro 訂閱的 20 倍；Pro 計畫的用量限制則是免費計畫的五倍。然而，Anthropic 表示免費使用者的限制「將隨需求變化」，並未設定絕對值。這導致使用者無法規劃用量限制，因為他們無法清楚知道服務何時會受到限制。每月 200 美元的 Max 計畫特別受重度使用者歡迎，部分使用者認為該計畫在長遠來看對 Anthropic 不可持續。一名受訪使用者表示，該計畫通常允許他在單日內進行超過 1000 美元價值（按 API 定價計算）的呼叫。因此，他並不驚訝用量限制會變得更加嚴格，但希望公司能更清晰地溝通變更。他強調，缺乏溝通會讓人失去對公司的信心，呼籲公司保持透明。

文章

信心資安「AI 的信號」從隱形模式推出，獲420萬美元資金

Mistral 的 Le Chat 聊天機器人推出新「深度研究」模式提升生產力

OpenAI 發佈通用代理程式於 ChatGPT

Anthropic 無預告縮減 Claude Code 使用上限