分類: 安全與政策

「安全與政策」分類的 AI 新聞與論文。

OpenAI 加入開放來源工具協助開發者打造青少年安全應用

2026年3月24日

OpenAI 於週二宣佈推出新一組提示詞，供開發者使用以增強其應用程式對青少年的安全性。這套青少年安全政策可應用於其開放權重的安全模型 gpt-oss-safeguard，讓開發者無需從零開始研究如何讓 AI 對青少年更安全，而是直接利用這些提示詞來加固所建構的產品。這些政策涵蓋了圖畫暴力、性內容、有害的身形理想與行為、危險活動與挑戰、浪漫或暴力角色扮演，以及年齡限制商品與服務等議題。由於這些安全政策設計為提示詞，它們與 gpt-oss-safeguard 以外的其他模型相容，雖然在 OpenAI 的生態系統中效果可能最佳。OpenAI 表示，在撰寫這些提示詞時，他們與 AI 安全監管機構 Common Sense Media 及 everyone.ai 合作。Common Sense Media 的 Robbie Torney 指出，這些基於提示詞的政策有助於在生態系統中建立有意義的安全基準，且因以開源形式發布，可隨時間適應與改進。OpenAI 承認開發者，包括經驗豐富的團隊，常難以將安全目標轉化為精確的運作規則，這可能導致保護漏洞、執行不一致或過濾過於寬泛。Clear, well-scoped policies are a critical foundation for effective safety systems. OpenAI 也承認這些政策並非解決 AI 安全複雜挑戰的終極方案，而是建立在其先前努力之上，包括產品層面的防護措施，如家長控制與年齡預測。去年，OpenAI 更新了其大型語言模型 Model Spec 的指南，以處理其 AI 模型與十八歲以下使用者的互動方式。儘管如此，OpenAI 自身的紀錄並不完美，公司正面臨多起訴訟，由因極端使用 ChatGPT 而自殺者家屬提起。這些危險關係通常發生在使用者繞過聊天機器人防護措施之後，且沒有任何模型的防護圍欄是完全不可穿透的。然而，這些政策至少是向前邁進的一步，特別是因為它能幫助獨立開發者。
出版商因AI疑慮撤下恐怖小說《害羞女孩》

2026年3月21日

哈切特書業集團宣佈將不再出版小說《害羞女孩》，原因是擔心該作品使用了人工智慧生成文字。這部小說原本計劃於今年春季在美國出版，但出版社決定同時停止在英國的銷售，因為該書在英國已可購買。儘管出版商聲稱此決定經過了嚴謹的文字審查，但 GoodReads 和 YouTube 上的評論者一直猜測該書極可能由人工智慧創作。《紐約時報》在公告前一天曾向哈切特書業詢問過相關疑慮。在致《紐約時報》的郵件中，作者米婭·巴拉德否認使用人工智慧撰寫小說，並將責任歸咎於她僱用的一位熟人，該人負責編輯《害羞女孩》最初的自出版版本。巴拉德表示她正採取法律行動，並指出由於這場爭議，她的心理健康降至最低點，且她的名聲因她未親自參與的事情而受損。作家林肯·米歇爾及其他業界觀察者指出，美國出版商在收購其他形式已出版的作品時，通常不會進行廣泛的編輯工作。
川普的AI框架針對州法規，將兒童安全責任轉嫁給父母

2026年3月20日

特朗普政府於週五提出了一項立法框架，旨在為美國制定統一的 AI 政策。該框架將權力集中於華盛頓，並透過預先廢除州級 AI 法規來削弱各州近期推動的監管努力。白宮宣告強調，唯有在整個美國統一執行此框架，才能避免衝突的州法損害創新並阻礙美國在全球 AI 競賽中的領導地位。該框架列出了七項關鍵目標，優先考慮創新與 AI 規模化，並建議聯邦層級法規覆蓋較嚴格的州級規定。框架將兒童安全等問題的主要責任歸於家長，對平臺責任設定相對柔軟且無約束力的期望。例如，它要求國會強制 AI 公司實施減少兒童性剝削和傷害的功能，但未提出明確可執行的要求。這是在特朗普簽署行政命令挑戰州 AI 法規後僅三個月提出的，該命令賦予商務部 90 天時間編列「繁瑣」的州法清單，可能影響各州獲得聯邦資金如寬頻補助金的資格。此框架呼應特朗普早期的 AI 策略，即更關注促進公司成長而非設立監管邊界，並提出「負擔最小的國家標準」以加速產業採用。儘管框架承認聯邦主義，但對各州的豁免範圍狹窄，僅保留其在詐欺、兒童保護、 zoning 等一般法律方面的權力，並明確反對各州監管 AI 開發，稱其為涉及國家安全和外交政策的「本質上跨州」問題。框架還試圖防止各州因第三方違法行為而對 AI 開發者進行處罰，為開發者提供關鍵的責任保護。然而，該框架缺乏針對新型危害的責任框架、獨立監督或執行機制。批評者指出，各州作為民主沙盒，能更快透過應對新興風險的法律，如紐約州的 RAISE 法案和加州的 SB-53 號法案，旨在確保大型 AI 公司遵守公開記錄的安全協議。在兒童安全方面，框架強調家長控制而非平臺責任，呼籲國會賦予家長管理數位環境的工具。關於版權，框架試圖在保護創作者與允許 AI 系統使用現有作品之間取得平衡，引用「合理使用」概念。主要監管邊界涉及確保 AI 能追求真實與準確，重點在於防止政府驅動的審查，而非平臺自身的內容審核。框架要求國會防止政府基於派系或意識形態強迫 AI 提供商禁止或
Meta 推出新 AI 內容監控系統並減少對第三方廠商的依賴

2026年3月19日

Meta 於週四宣佈將開始逐步部署更先進的 AI 系統以處理內容執法工作，並計劃減少對第三方供應商的重置。這些任務包括識別並移除涉及恐怖主義、兒童剝削、毒品、詐騙及欺詐的內容。公司表示，一旦這些新系統在表現上持續優於現有方法，便會將其應用於所有應用程式。同時，Meta 將降低對第三方供應商在內容執法方面的依賴。雖然仍有人員參與內容審查，但新系統將接手更適合技術處理的工作，例如重複性的圖形內容審查，或是應對惡意行為者不斷改變戰術的領域，如非法毒品銷售或詐騙。Meta 認為這些 AI 系統能更準確地檢測違規行為，更好地預防詐騙，對現實世界事件反應更迅速，並減少過度執法。早期測試顯示，這些系統檢測到的成人性誘惑內容數量是審查團隊的兩倍，同時錯誤率降低了超過 60%。此外，系統能識別並阻止涉及名人及其他高知名度人物的假冒帳戶，並透過檢測新地點登入、密碼變更或個人資料編輯等訊號來協助防止帳戶接管。Meta 表示，這些系統每天能識別並緩解約 5,000 起詐騙嘗試，詐騙者試圖藉此騙取使用者的登入資訊。專家將負責設計、訓練、監督和評估這些 AI 系統，測量其表現並做出最複雜且影響重大的決策。例如，人員仍將在最高風險和關鍵決策中發揮關鍵作用，例如處理帳戶停用上訴或向執法機構報告。此舉發生在過去一年 Meta 放鬆內容審查規則的背景下，當時唐納德·特朗普再次當選總統。去年，公司終止了第三方事實核查計劃，改為類似 X 的社群筆記模式，並解除了關於「主流討論話題」的限制，鼓勵使用者採取「個人化」方式處理政治內容。同時，Meta 及其他大型科技公司正面臨多起訴訟，要求對損害兒童及年輕使用者負責。此外，Meta 於週四宣佈推出 Meta AI 支援助手，提供 24/7 支援服務。該助手將在全球範圍內向 Facebook 和 Instagram 的 iOS 及 Android 應用程式推出，並在 Facebook 和 Instagram 桌面版的幫助中心內可用。

分類: 安全與政策

OpenAI 加入開放來源工具協助開發者打造青少年安全應用

出版商因AI疑慮撤下恐怖小說《害羞女孩》

川普的AI框架針對州法規，將兒童安全責任轉嫁給父母

Meta 推出新 AI 內容監控系統並減少對第三方廠商的依賴