分類: 安全與政策
「安全與政策」分類的 AI 新聞與論文。
-
Guide Labs 發表一種新型可解釋的 LLM
Guide Labs 是一家由 CEO Julius Adebayo 和首席科學官 Aya Abdelsalam Ismail 於 2024 年 11 月從 Y Combinator 孵化並獲得 Initialized Capital 900 萬美元種子輪融資的舊金山創業公司,旨在解決深度學習模型難以解釋的挑戰。該公司今日公開了名為 Steerling-8B 的 80 億引數大型語言模型,該模型採用新架構設計,使其行為具有高度可解釋性。在該架構下,模型產生的每個 token 都能追溯至訓練資料的來源,這使得確定模型引用事實的參考資料或理解其對幽默、性別等概念的認知變得可行。Adebayo 指出,雖然現有模型也能做到,但這種方法非常脆弱,而 Steerling-8B 透過在模型中插入概念層將資料分組為可追蹤類別,將可解釋性從神經科學問題轉變為工程問題。儘管這種方法需要額外的資料標註,但團隊利用其他 AI 模型協助訓練,成功證明瞭其可行性。Adebayo 表示,該模型能達到現有模型 90% 的能力,但使用了更少的訓練資料,並且保留了模型自行發現概念(如量子計算)的突發行為。對於消費級 LLM、受監管行業(如金融)以及科學研究(如蛋白質摺疊),這種可解釋性至關重要,有助於控制版權內容、暴力或藥物濫用等輸出,並讓模型在評估貸款申請時考慮財務記錄而非種族。Guide Labs 的下一步是構建更大規模的模型,並開始向使用者提供 API 和智慧體訪問服務,以實現可解釋性的民主化。
-
OpenAI 討論是否應報警處理涉嫌加拿大槍手的聊天紀錄
一名十八歲的加拿大少女傑西·範·魯斯特拉爾(Jesse Van Rootselaar)被指控在泰姆勒裡奇(Tumbler Ridge)發生大規模槍擊案,造成八人死亡。據報導,她在與 OpenAI 的 ChatGPT 對話中描述槍擊暴力行為,這些內容被公司監控工具標記為誤用,導致其帳號於 2025 年 6 月被封鎖。OpenAI 員工曾討論是否向加拿大執法機構通報,但最終決定不直接通報,因為該行為不符合通報標準。然而,OpenAI 發言人表示,公司已主動聯絡加拿大皇家騎警(Royal Canadian Mounted Police),提供有關該個人及其使用 ChatGPT 情況的資訊,以協助調查。發言人同時表達對泰姆勒裡奇悲劇中受影響者的哀悼。 除了 ChatGPT 對話外,範·魯斯特拉爾的數位足跡也引發關注。她在 Roblox 平臺上建立了一個模擬商場槍擊的遊戲,該平臺常被兒童使用。她還在 Reddit 上發布過關於槍支的內容。當地警方也已知悉她的心理不穩定,曾因她在服用不明藥物後在家起火而被召喚。文章指出,由 OpenAI 及其競爭對手開發的語言模型聊天機器人曾被指觸發使用者精神崩潰,導致現實感喪失。多起訴訟引用了鼓勵自殺或協助自殺的聊天記錄。文末提醒讀者,若處於危機或懷有自殺念頭,應撥打或傳送訊息至 988 自殺與危機熱線。
-
微軟表示Office的漏洞導致客戶的機密郵件暴露給Copilot AI
微軟確認一個漏洞允許其 Copilot AI 在未經許可的情況下,數週來總結客戶的機密郵件。該漏洞最早由 Bleeping Computer 報告,使得 Copilot Chat 自一月以來能夠閱讀並概述郵件內容,即使客戶已實施資料防洩漏政策以防止敏感資訊被吸入微軟的大型語言模型。Copilot Chat 允許付費使用微軟 365 的客戶在其 Office 軟體產品中利用 AI 驅動的聊天功能,包括 Word、Excel 和 PowerPoint。微軟表示,可追蹤為 CW1226324 的漏洞意味著帶有「機密」標籤的草擬和已傳送郵件正被錯誤地處理。科技巨頭表示,它於二月初開始推出修復方案。當被聯絡時,微軟發言人並未說明受此漏洞影響的客戶數量。本週早些時候,歐洲議會的 IT 部門告訴立法者,他們阻擋了工作裝置內建的 AI 功能,理由是擔心 AI 工具可能將潛在機密的通訊上傳至雲端。
-
歐洲議會封鎖議員設備使用AI 該會 citing 安全風險
歐洲議會據報已阻止議員在其工作裝置上使用內建的人工智慧工具,理由是將機密通訊上傳至雲端存在網路安全與隱私風險。根據《政治報》獲悉的郵件內容,議會的資訊技術部門表示無法保證上傳至人工智慧公司伺服器的資料安全性,並指出與人工智慧公司共享資訊的完整範圍「仍在評估中」。因此,郵件建議將相關功能保持禁用狀態。將資料上傳至如 Anthropic 的 Claude、Microsoft 的 Copilot 或 OpenAI 的 ChatGPT 等人工智慧聊天機器人,意味著美國當局可要求執行這些聊天機器人的公司交出使用者資訊。此外,人工智慧聊天機器人通常依賴使用者提供的資訊來改進模型,這增加了單一使用者上傳的潛在敏感資訊被其他使用者看到或共享的風險。歐洲擁有世界最嚴格的資料保護規則之一,但歐洲委員會去年曾提出新立法提案,旨在放鬆資料保護規則,以便科技巨頭更容易使用歐洲人的資料訓練其人工智慧模型,此舉引發批評者不滿,認為這是向美國科技巨頭妥協。限制歐洲議員使用裝置上人工智慧產品的舉措,正值歐盟成員國重新評估與美國科技巨頭關係之際,這些巨頭仍受美國法律約束,並需應對特朗普政府不可預測的要求。最近幾週,美國國土安全部已向數百家美國科技和社交媒體巨頭發出傳票,要求交出關於包括公開批評特朗普政府政策的美國人在內的人員資訊。Google、Meta 和 Reddit 在數起案件中配合了這些要求,儘管這些傳票並非由法官發出,也未由法院執行。