文章
所有發布的 AI 新聞與論文。
-
信心資安「AI 的信號」從隱形模式推出,獲420萬美元資金
隨著消費者、企業和政府紛紛擁抱便宜且快速的 AI 工具,資料隱私成為關鍵障礙。科技巨頭如 OpenAI、Anthropic、xAI、Google 等正悄悄收集並保留使用者資料以最佳化模型或監控安全,這在高度監管行業如醫療、金融和政府部門中可能成為採用 AI 的阻礙。基於舊金山的初創公司 Confident Security 推出產品 CONFSEC,旨在成為"AI 的 Signal"。CONFSEC 是一種端到端加密工具,可包裹基礎模型,確保提示詞和後設資料無法被儲存、檢視或用於 AI 訓練,即使對模型提供商或第三方也是如此。創辦人兼執行長 Jonathan Mortensen 表示,交出資料會降低隱私,而該產品的目標是消除這種權衡。 Confident Security 於週四以 420 萬美元種子資金退出隱形階段,投資方包括 Decibel、South Park Commons、Ex Ante 和 Swyx。公司希望作為 AI 供應商與客戶(如超規模計算服務商、政府和企業)之間的中介供應商。Mortensen 指出,AI 公司也可透過提供此工具來開發企業市場。CONFSEC 亦適合新推出的 AI 瀏覽器,如 Perplexity 最近發布的 Comet,以確保敏感資料不會被儲存於公司或惡意行為者可訪問的伺服器上,且工作相關提示詞不會被用於訓練 AI 來取代使用者工作。 CONFSEC 的架構參考了 Apple 的 Private Cloud Compute (PCC),Mortensen 稱其在確保 Apple 無法檢視資料方面比現有解決方案好 10 倍。系統運作方式為先將資料匿名化,透過加密並路由至 Cloudflare 或 Fastly 等服務,使伺服器從未見原始內容。接著使用僅能在嚴格條件下解密的先進加密技術,例如僅允許在不記錄資料、不用於訓練且不被他人檢視的情況下解碼。最後,執行 AI 推論的軟體會公開記錄並接受審查,讓專家驗證其保證。Decibel 的合夥人 Jess Leão 表示,未來 AI 取決於基礎設施內建的信任,沒有此類解決方案,許多企業無法推進 AI 發展。這家成立一年的公司雖處早期階段,但 CONFSEC 已接受測試、外部審計並具備生產 readiness。團隊正與銀行、瀏覽器及搜尋引擎等潛在客戶洽談,以將 CONFSEC 納入其基礎設施
-
Mistral 的 Le Chat 聊天機器人推出新「深度研究」模式提升生產力
法國人工智慧實驗室 Mistral 於週四為其聊天機器人 Le Chat 推出了一系列新功能,使其能力更接近 OpenAI 和 Google 等競爭對手。此次更新包含全新的「深度研究」模式、原生多語言推理能力以及進階的圖片編輯功能。這是在 Mistral 數天前發布其首款開源 AI 語音模型 Voxtral 之後發生的,該模型支援多語言推理、轉錄等功能,且也可透過 Le Chat 使用。Mistral 表示,其新的深度研究模式能將 Le Chat 轉變為協同研究助理,可規劃需求、澄清疑問、搜尋並綜合資料。產品負責人 Elisa Salamanca 指出,該功能對消費者和企業使用者都極具相關性,消費者可用於規劃旅行並獲得詳盡分析,企業則可用於深入研究。 這些更新適用於所有層級,包括免費、專業、團隊和企業版。Mistral 強調此次發布重點在於將 Le Chat 與其生產力套件整合進企業生態系統,這主要取決於 Mistral 處理資料聯結器的不同方式。許多擁有敏感資料的客戶(如銀行、國防和政府部門)不使用雲端服務,或僅在虛擬私人雲上執行。為此,Mistral 的 Le Chat 和生產力套件可連線企業本地資料,讓公司無需上傳資料至雲端即可分析內部資料,這與 Azure 託管的 OpenAI 和基於 Google Cloud 的 Gemini 等雲端原生大型語言模型平臺形成顯著差異。此外,Mistral 還計劃推出更多生產力工具,使其與 Microsoft Excel 和 Google Docs 等辦公套件無縫協作。 除了深度研究,Le Chat 還獲得了其他更新。此前僅支援英文的複雜問題推理能力,現在已原生支援法語、西班牙語、日語等多種語言,並支援句子中切換語言。此次更新還新增了專案功能,幫助使用者將聊天、文件和想法分組到專注的空間中,每個專案可擁有獨立的預設庫並記住使用者啟用的工具和設定,適用於規劃搬家、設計新功能或追蹤工作專案。最後,Le Chat 獲得了改進的圖片編輯能力,允許使用者使用提示詞建立和編輯圖片,例如「移除物件」或「將我置於另一座城市」。這些新功能將 Mistral 置於更具競爭力的位置,使其不僅僅是模型演示,更成為全棧競爭對手。
-
OpenAI 發佈通用代理程式於 ChatGPT
OpenAI 於 2025 年 7 月 17 日推出全新通用目的 AI 代理 ChatGPT agent,該工具整合了 Operator 的網頁操作能力與 Deep Research 的資訊綜合能力,旨在讓使用者透過自然語言指令完成複雜的電腦任務。此功能於週四向 Pro、Plus 及 Team 訂閱者開放,使用者可在 ChatGPT 下拉選單中選擇「agent mode」以啟用。該代理具備自動瀏覽網頁、管理日曆、生成可編輯簡報與幻燈片、執行程式碼以及連線 Gmail 與 GitHub 等應用程式的能力。在效能測試方面,ChatGPT agent 模型在 Humanity's Last Exam 測試中得分為 41.6%,約為 o3 與 o4-mini 模型得分的兩倍;在 FrontierMath 數學 benchmarks 中,若具備終端機等工具輔助,其得分為 27.4%,遠高於 o4-mini 的 6.3%。由於該代理具備更強大的自主行動能力,OpenAI 將其標記為生物與化學武器領域的「高能力」模型,並啟動了即時監控系統與分類器,以攔截可能引發生物威脅的回應。此外,為防止惡意使用者透過提示注入攻擊洩漏敏感資料,OpenAI 暫時關閉了該代理的記憶功能。儘管技術表現亮眼,業界仍關注其在真實世界環境中的穩定性與安全性。
-
Anthropic 無預告縮減 Claude Code 使用上限
自本週一早晨起,Claude Code 使用者遭遇突發且嚴格的用量限制問題。這些問題主要集中在重度使用者身上,許多使用者訂閱的是每月 200 美元的 Max 計畫。使用者僅收到「Claude 用量限制已達上限」的提示,並被告知通常在數小時內限制將重置,但由於缺乏明確的變更公告,許多使用者推測其訂閱已被降級或用量追蹤不準確。有使用者抱怨追蹤方式改變且不再準確,指出在短短 30 分鐘內僅發出幾條請求卻觸發了 900 條訊息的限制。 當被要求評論時,Anthropic 代表確認了問題但拒絕進一步說明,僅表示已知部分使用者體驗到回應速度變慢,並正在解決中。此變化令使用者感到震驚,因為他們未收到任何預先通知或未來指引。一名不願具名的使用者表示,自限制生效後無法推進專案,並嘗試過 Gemini 和 Kimi 等替代方案,但認為目前無其他產品能與 Claude Code 的能力相比。 這些問題伴隨著 Anthropic 網路的廣泛問題。許多 API 使用者在同一時期報告了超載錯誤,公司狀態頁面顯示過去四天內有六個獨立問題。值得注意的是,網路在該週仍顯示 100% 的執行時間。雖然載入錯誤常見,但 Anthropic 對用量限制的新方法造成了顯著混亂。部分混亂源於其定價系統,該系統設定分級限制卻從未保證固定的訪問水平。最昂貴的 Max 計畫每月 200 美元,承諾的用量限制是 Pro 訂閱的 20 倍;Pro 計畫的用量限制則是免費計畫的五倍。然而,Anthropic 表示免費使用者的限制「將隨需求變化」,並未設定絕對值。這導致使用者無法規劃用量限制,因為他們無法清楚知道服務何時會受到限制。 每月 200 美元的 Max 計畫特別受重度使用者歡迎,部分使用者認為該計畫在長遠來看對 Anthropic 不可持續。一名受訪使用者表示,該計畫通常允許他在單日內進行超過 1000 美元價值(按 API 定價計算)的呼叫。因此,他並不驚訝用量限制會變得更加嚴格,但希望公司能更清晰地溝通變更。他強調,缺乏溝通會讓人失去對公司的信心,呼籲公司保持透明。