OpenAI 加入開放來源工具協助開發者打造青少年安全應用

OpenAI 於週二宣佈推出新一組提示詞，供開發者使用以增強其應用程式對青少年的安全性。這套青少年安全政策可應用於其開放權重的安全模型 gpt-oss-safeguard，讓開發者無需從零開始研究如何讓 AI 對青少年更安全，而是直接利用這些提示詞來加固所建構的產品。這些政策涵蓋了圖畫暴力、性內容、有害的身形理想與行為、危險活動與挑戰、浪漫或暴力角色扮演，以及年齡限制商品與服務等議題。由於這些安全政策設計為提示詞，它們與 gpt-oss-safeguard 以外的其他模型相容，雖然在 OpenAI 的生態系統中效果可能最佳。OpenAI 表示，在撰寫這些提示詞時，他們與 AI 安全監管機構 Common Sense Media 及 everyone.ai 合作。Common Sense Media 的 Robbie Torney 指出，這些基於提示詞的政策有助於在生態系統中建立有意義的安全基準，且因以開源形式發布，可隨時間適應與改進。OpenAI 承認開發者，包括經驗豐富的團隊，常難以將安全目標轉化為精確的運作規則，這可能導致保護漏洞、執行不一致或過濾過於寬泛。Clear, well-scoped policies are a critical foundation for effective safety systems. OpenAI 也承認這些政策並非解決 AI 安全複雜挑戰的終極方案，而是建立在其先前努力之上，包括產品層面的防護措施，如家長控制與年齡預測。去年，OpenAI 更新了其大型語言模型 Model Spec 的指南，以處理其 AI 模型與十八歲以下使用者的互動方式。儘管如此，OpenAI 自身的紀錄並不完美，公司正面臨多起訴訟，由因極端使用 ChatGPT 而自殺者家屬提起。這些危險關係通常發生在使用者繞過聊天機器人防護措施之後，且沒有任何模型的防護圍欄是完全不可穿透的。然而，這些政策至少是向前邁進的一步，特別是因為它能幫助獨立開發者。