跳至內容
AI 新聞站
返回

OpenAI 加入開放來源工具協助開發者打造青少年安全應用

OpenAI 於週二宣佈推出新一組提示詞,供開發者使用以增強其應用程式對青少年的安全性。這套青少年安全政策可應用於其開放權重的安全模型 gpt-oss-safeguard,讓開發者無需從零開始研究如何讓 AI 對青少年更安全,而是直接利用這些提示詞來加固所建構的產品。這些政策涵蓋了圖畫暴力、性內容、有害的身形理想與行為、危險活動與挑戰、浪漫或暴力角色扮演,以及年齡限制商品與服務等議題。由於這些安全政策設計為提示詞,它們與 gpt-oss-safeguard 以外的其他模型相容,雖然在 OpenAI 的生態系統中效果可能最佳。OpenAI 表示,在撰寫這些提示詞時,他們與 AI 安全監管機構 Common Sense Media 及 everyone.ai 合作。Common Sense Media 的 Robbie Torney 指出,這些基於提示詞的政策有助於在生態系統中建立有意義的安全基準,且因以開源形式發布,可隨時間適應與改進。OpenAI 承認開發者,包括經驗豐富的團隊,常難以將安全目標轉化為精確的運作規則,這可能導致保護漏洞、執行不一致或過濾過於寬泛。Clear, well-scoped policies are a critical foundation for effective safety systems. OpenAI 也承認這些政策並非解決 AI 安全複雜挑戰的終極方案,而是建立在其先前努力之上,包括產品層面的防護措施,如家長控制與年齡預測。去年,OpenAI 更新了其大型語言模型 Model Spec 的指南,以處理其 AI 模型與十八歲以下使用者的互動方式。儘管如此,OpenAI 自身的紀錄並不完美,公司正面臨多起訴訟,由因極端使用 ChatGPT 而自殺者家屬提起。這些危險關係通常發生在使用者繞過聊天機器人防護措施之後,且沒有任何模型的防護圍欄是完全不可穿透的。然而,這些政策至少是向前邁進的一步,特別是因為它能幫助獨立開發者。


分享這篇文章:

上一篇
Google TV 新推出的 Gemini 功能讓球迷隨時掌握球隊動態及其他資訊
下一篇
塔拉之AI會議筆記儲存於您機器內,而非雲端