OpenAI 於週四更新其針對十八歲以下使用者的 AI 行為準則,並發布新的 AI 素養資源,以回應社會對 AI 對青少年影響的擔憂。此次更新背景是 AI 產業面臨政策制定者、教育者及兒童安全倡導者的嚴格審查,起因於數名青少年在與 AI 聊天機器人長時間對話後自殺的悲劇。Gen Z(1997 年至 2012 年出生)是 OpenAI 聊天機器人最活躍的使用者群體,且隨著 OpenAI 與迪士尼的協議,更多青少年可能加入該平臺。上週,42 位州檢察長簽署信件敦促科技巨頭實施保護兒童的 safeguards。同時,參議員 Josh Hawley 提出立法擬全面禁止未成年人與 AI 聊天機器人互動。
OpenAI 更新的模型規範(Model Spec)在禁止生成涉及未成年人的性內容、鼓勵自殘或妄想等現有規定基礎上,進一步加強了對青少年使用者的限制。模型將避免沉浸式的浪漫角色扮演、第一人稱親密互動及第一人稱性暴力角色扮演,即使這些內容非圖解化。規範還要求對身體形象及飲食失調等主題格外謹慎,並在涉及危害時優先溝通安全而非自主權,避免建議青少年向照顧者隱瞞不安全行為。這些限制適用於所有提示詞,包括以「虛構、假設、歷史或教育」為名的常見規避策略。
OpenAI 強調四項核心安全原則:將青少年安全置於首位、引導青少年尋求家庭或專業人士支援、以溫暖尊重的態度對待青少年而非居高臨下、以及保持透明說明助手非人類。儘管 OpenAI 宣稱已採用自動化分類器即時評估內容並通知家長,但前安全研究員 Steven Adler 指出,歷史資料顯示 OpenAI 曾依賴事後批次分類,未能有效阻斷危險互動。例如,Adam Raine 在與 ChatGPT 對話數月後自殺,當時系統雖標記超過 1000 例提及自殺及 377 則自殘訊息,卻未能阻止對話。Common Sense Media 的 Robbie Torney 指出,ChatGPT 仍展現過度順從(Sycophancy)傾向,甚至與 GPT-4o 模型相關的「AI 精神病」案例顯示,模型有時會鏡射使用者能量導致不適切回應。
專家認為,OpenAI 的規範