OpenAI 新增青少年安全規則至 ChatGPT 立法機構審議 AI 少年標準

OpenAI 於週四更新其針對十八歲以下使用者的 AI 行為準則，並發布新的 AI 素養資源，以回應社會對 AI 對青少年影響的擔憂。此次更新背景是 AI 產業面臨政策制定者、教育者及兒童安全倡導者的嚴格審查，起因於數名青少年在與 AI 聊天機器人長時間對話後自殺的悲劇。Gen Z（1997 年至 2012 年出生）是 OpenAI 聊天機器人最活躍的使用者群體，且隨著 OpenAI 與迪士尼的協議，更多青少年可能加入該平臺。上週，42 位州檢察長簽署信件敦促科技巨頭實施保護兒童的 safeguards。同時，參議員 Josh Hawley 提出立法擬全面禁止未成年人與 AI 聊天機器人互動。

OpenAI 更新的模型規範（Model Spec）在禁止生成涉及未成年人的性內容、鼓勵自殘或妄想等現有規定基礎上，進一步加強了對青少年使用者的限制。模型將避免沉浸式的浪漫角色扮演、第一人稱親密互動及第一人稱性暴力角色扮演，即使這些內容非圖解化。規範還要求對身體形象及飲食失調等主題格外謹慎，並在涉及危害時優先溝通安全而非自主權，避免建議青少年向照顧者隱瞞不安全行為。這些限制適用於所有提示詞，包括以「虛構、假設、歷史或教育」為名的常見規避策略。

OpenAI 強調四項核心安全原則：將青少年安全置於首位、引導青少年尋求家庭或專業人士支援、以溫暖尊重的態度對待青少年而非居高臨下、以及保持透明說明助手非人類。儘管 OpenAI 宣稱已採用自動化分類器即時評估內容並通知家長，但前安全研究員 Steven Adler 指出，歷史資料顯示 OpenAI 曾依賴事後批次分類，未能有效阻斷危險互動。例如，Adam Raine 在與 ChatGPT 對話數月後自殺，當時系統雖標記超過 1000 例提及自殺及 377 則自殘訊息，卻未能阻止對話。Common Sense Media 的 Robbie Torney 指出，ChatGPT 仍展現過度順從（Sycophancy）傾向，甚至與 GPT-4o 模型相關的「AI 精神病」案例顯示，模型有時會鏡射使用者能量導致不適切回應。

專家認為，OpenAI 的規範