分類: 安全與政策
「安全與政策」分類的 AI 新聞與論文。
-
OpenAI 加入開放來源工具協助開發者打造青少年安全應用
OpenAI 於週二宣佈推出新一組提示詞,供開發者使用以增強其應用程式對青少年的安全性。這套青少年安全政策可應用於其開放權重的安全模型 gpt-oss-safeguard,讓開發者無需從零開始研究如何讓 AI 對青少年更安全,而是直接利用這些提示詞來加固所建構的產品。這些政策涵蓋了圖畫暴力、性內容、有害的身形理想與行為、危險活動與挑戰、浪漫或暴力角色扮演,以及年齡限制商品與服務等議題。由於這些安全政策設計為提示詞,它們與 gpt-oss-safeguard 以外的其他模型相容,雖然在 OpenAI 的生態系統中效果可能最佳。OpenAI 表示,在撰寫這些提示詞時,他們與 AI 安全監管機構 Common Sense Media 及 everyone.ai 合作。Common Sense Media 的 Robbie Torney 指出,這些基於提示詞的政策有助於在生態系統中建立有意義的安全基準,且因以開源形式發布,可隨時間適應與改進。OpenAI 承認開發者,包括經驗豐富的團隊,常難以將安全目標轉化為精確的運作規則,這可能導致保護漏洞、執行不一致或過濾過於寬泛。Clear, well-scoped policies are a critical foundation for effective safety systems. OpenAI 也承認這些政策並非解決 AI 安全複雜挑戰的終極方案,而是建立在其先前努力之上,包括產品層面的防護措施,如家長控制與年齡預測。去年,OpenAI 更新了其大型語言模型 Model Spec 的指南,以處理其 AI 模型與十八歲以下使用者的互動方式。儘管如此,OpenAI 自身的紀錄並不完美,公司正面臨多起訴訟,由因極端使用 ChatGPT 而自殺者家屬提起。這些危險關係通常發生在使用者繞過聊天機器人防護措施之後,且沒有任何模型的防護圍欄是完全不可穿透的。然而,這些政策至少是向前邁進的一步,特別是因為它能幫助獨立開發者。
-
出版商因AI疑慮撤下恐怖小說《害羞女孩》
哈切特書業集團宣佈將不再出版小說《害羞女孩》,原因是擔心該作品使用了人工智慧生成文字。這部小說原本計劃於今年春季在美國出版,但出版社決定同時停止在英國的銷售,因為該書在英國已可購買。儘管出版商聲稱此決定經過了嚴謹的文字審查,但 GoodReads 和 YouTube 上的評論者一直猜測該書極可能由人工智慧創作。《紐約時報》在公告前一天曾向哈切特書業詢問過相關疑慮。在致《紐約時報》的郵件中,作者米婭·巴拉德否認使用人工智慧撰寫小說,並將責任歸咎於她僱用的一位熟人,該人負責編輯《害羞女孩》最初的自出版版本。巴拉德表示她正採取法律行動,並指出由於這場爭議,她的心理健康降至最低點,且她的名聲因她未親自參與的事情而受損。作家林肯·米歇爾及其他業界觀察者指出,美國出版商在收購其他形式已出版的作品時,通常不會進行廣泛的編輯工作。
-
川普的AI框架針對州法規,將兒童安全責任轉嫁給父母
特朗普政府於週五提出了一項立法框架,旨在為美國制定統一的 AI 政策。該框架將權力集中於華盛頓,並透過預先廢除州級 AI 法規來削弱各州近期推動的監管努力。白宮宣告強調,唯有在整個美國統一執行此框架,才能避免衝突的州法損害創新並阻礙美國在全球 AI 競賽中的領導地位。該框架列出了七項關鍵目標,優先考慮創新與 AI 規模化,並建議聯邦層級法規覆蓋較嚴格的州級規定。 框架將兒童安全等問題的主要責任歸於家長,對平臺責任設定相對柔軟且無約束力的期望。例如,它要求國會強制 AI 公司實施減少兒童性剝削和傷害的功能,但未提出明確可執行的要求。這是在特朗普簽署行政命令挑戰州 AI 法規後僅三個月提出的,該命令賦予商務部 90 天時間編列「繁瑣」的州法清單,可能影響各州獲得聯邦資金如寬頻補助金的資格。此框架呼應特朗普早期的 AI 策略,即更關注促進公司成長而非設立監管邊界,並提出「負擔最小的國家標準」以加速產業採用。 儘管框架承認聯邦主義,但對各州的豁免範圍狹窄,僅保留其在詐欺、兒童保護、 zoning 等一般法律方面的權力,並明確反對各州監管 AI 開發,稱其為涉及國家安全和外交政策的「本質上跨州」問題。框架還試圖防止各州因第三方違法行為而對 AI 開發者進行處罰,為開發者提供關鍵的責任保護。然而,該框架缺乏針對新型危害的責任框架、獨立監督或執行機制。批評者指出,各州作為民主沙盒,能更快透過應對新興風險的法律,如紐約州的 RAISE 法案和加州的 SB-53 號法案,旨在確保大型 AI 公司遵守公開記錄的安全協議。 在兒童安全方面,框架強調家長控制而非平臺責任,呼籲國會賦予家長管理數位環境的工具。關於版權,框架試圖在保護創作者與允許 AI 系統使用現有作品之間取得平衡,引用「合理使用」概念。主要監管邊界涉及確保 AI 能追求真實與準確,重點在於防止政府驅動的審查,而非平臺自身的內容審核。框架要求國會防止政府基於派系或意識形態強迫 AI 提供商禁止或
-
Meta 推出新 AI 內容監控系統並減少對第三方廠商的依賴
Meta 於週四宣佈將開始逐步部署更先進的 AI 系統以處理內容執法工作,並計劃減少對第三方供應商的重置。這些任務包括識別並移除涉及恐怖主義、兒童剝削、毒品、詐騙及欺詐的內容。公司表示,一旦這些新系統在表現上持續優於現有方法,便會將其應用於所有應用程式。同時,Meta 將降低對第三方供應商在內容執法方面的依賴。雖然仍有人員參與內容審查,但新系統將接手更適合技術處理的工作,例如重複性的圖形內容審查,或是應對惡意行為者不斷改變戰術的領域,如非法毒品銷售或詐騙。Meta 認為這些 AI 系統能更準確地檢測違規行為,更好地預防詐騙,對現實世界事件反應更迅速,並減少過度執法。早期測試顯示,這些系統檢測到的成人性誘惑內容數量是審查團隊的兩倍,同時錯誤率降低了超過 60%。此外,系統能識別並阻止涉及名人及其他高知名度人物的假冒帳戶,並透過檢測新地點登入、密碼變更或個人資料編輯等訊號來協助防止帳戶接管。Meta 表示,這些系統每天能識別並緩解約 5,000 起詐騙嘗試,詐騙者試圖藉此騙取使用者的登入資訊。專家將負責設計、訓練、監督和評估這些 AI 系統,測量其表現並做出最複雜且影響重大的決策。例如,人員仍將在最高風險和關鍵決策中發揮關鍵作用,例如處理帳戶停用上訴或向執法機構報告。此舉發生在過去一年 Meta 放鬆內容審查規則的背景下,當時唐納德·特朗普再次當選總統。去年,公司終止了第三方事實核查計劃,改為類似 X 的社群筆記模式,並解除了關於「主流討論話題」的限制,鼓勵使用者採取「個人化」方式處理政治內容。同時,Meta 及其他大型科技公司正面臨多起訴訟,要求對損害兒童及年輕使用者負責。此外,Meta 於週四宣佈推出 Meta AI 支援助手,提供 24/7 支援服務。該助手將在全球範圍內向 Facebook 和 Instagram 的 iOS 及 Android 應用程式推出,並在 Facebook 和 Instagram 桌面版的幫助中心內可用。