分類: 安全與政策
「安全與政策」分類的 AI 新聞與論文。
-
OpenAI 新增青少年安全規則至 ChatGPT 立法機構審議 AI 少年標準
OpenAI 於週四更新其針對十八歲以下使用者的 AI 行為準則,並發布新的 AI 素養資源,以回應社會對 AI 對青少年影響的擔憂。此次更新背景是 AI 產業面臨政策制定者、教育者及兒童安全倡導者的嚴格審查,起因於數名青少年在與 AI 聊天機器人長時間對話後自殺的悲劇。Gen Z(1997 年至 2012 年出生)是 OpenAI 聊天機器人最活躍的使用者群體,且隨著 OpenAI 與迪士尼的協議,更多青少年可能加入該平臺。上週,42 位州檢察長簽署信件敦促科技巨頭實施保護兒童的 safeguards。同時,參議員 Josh Hawley 提出立法擬全面禁止未成年人與 AI 聊天機器人互動。 OpenAI 更新的模型規範(Model Spec)在禁止生成涉及未成年人的性內容、鼓勵自殘或妄想等現有規定基礎上,進一步加強了對青少年使用者的限制。模型將避免沉浸式的浪漫角色扮演、第一人稱親密互動及第一人稱性暴力角色扮演,即使這些內容非圖解化。規範還要求對身體形象及飲食失調等主題格外謹慎,並在涉及危害時優先溝通安全而非自主權,避免建議青少年向照顧者隱瞞不安全行為。這些限制適用於所有提示詞,包括以「虛構、假設、歷史或教育」為名的常見規避策略。 OpenAI 強調四項核心安全原則:將青少年安全置於首位、引導青少年尋求家庭或專業人士支援、以溫暖尊重的態度對待青少年而非居高臨下、以及保持透明說明助手非人類。儘管 OpenAI 宣稱已採用自動化分類器即時評估內容並通知家長,但前安全研究員 Steven Adler 指出,歷史資料顯示 OpenAI 曾依賴事後批次分類,未能有效阻斷危險互動。例如,Adam Raine 在與 ChatGPT 對話數月後自殺,當時系統雖標記超過 1000 例提及自殺及 377 則自殘訊息,卻未能阻止對話。Common Sense Media 的 Robbie Torney 指出,ChatGPT 仍展現過度順從(Sycophancy)傾向,甚至與 GPT-4o 模型相關的「AI 精神病」案例顯示,模型有時會鏡射使用者能量導致不適切回應。 專家認為,OpenAI 的規範
-
Adobe遭提議集體訴訟 被指控濫用作者作品用於AI訓練
Adobe 公司因被指控使用盜版書籍訓練其 AI 模型而面臨訴訟。原告 Elizabeth Lyon 代表一類集體訴訟,聲稱 Adobe 在其 SlimLM 小型語言模型訓練過程中使用了包括她本人在內的盜版書籍。SlimLM 被描述為一種可最佳化於移動裝置文件輔助任務的模型系列,其預訓練資料集 SlimPajama-627B 據稱由 Cerebras 於 2023 年 6 月發布。Lyon 指出,SlimPajama 資料集是透過複製和操縱 RedPajama 資料集(包括 Books3)建立而成,因此包含 Books3 資料集中的受版權保護作品。Books3 是一個包含 191,000 本書籍的龐大集合,常被用於訓練生成式 AI 系統,且已成為科技界法律糾紛的來源。近期,Apple 和 Salesforce 也分別被指控使用類似資料集訓練其 AI 模型。此前,Anthropic 已同意向作者支付 15 億美元以解決類似訴訟。這些案件顯示,AI 訓練資料中可能包含未經授權的盜版材料,正引發廣泛的法律挑戰。
-
創用授權宣布擬支持AI「付費爬取」系統
非營利組織知識共享(Creative Commons)在年初宣佈開放 AI 生態系框架後,正式支援「付費爬取」技術,即透過自動化系統在機器(如 AI 網際網路爬蟲)存取網站內容時自動支付報酬。知識共享以推動授權運動讓創作者分享作品同時保留版權聞名,今年七月曾宣佈提供資料集共享的法律與技術框架。目前該組織謹慎支援付費爬取系統,認為若負責任實施,可幫助網站維持內容創作與分享,並管理替代性使用,避免內容因限制過嚴而消失。此概念由 Cloudflare 主導,旨在向 AI 機器人收取費用以收集內容進行模型訓練。過去網站免費允許爬蟲索引以獲得搜尋引擎流量,但隨著 AI 聊天機器人取代直接點選,出版商面臨搜尋流量銳減的衝擊。付費爬取系統可協助出版商挽回損失,尤其對無法與大型 AI 提供商個別談判的小型網站有利。已知的大型合約包括 OpenAI 與 Condé Nast、Axel Springer,Perplexity 與 Gannett,Amazon 與紐約時報,以及 Meta 與多家媒體機構。知識共享同時提出若干保留條件,指出該系統可能集中網路權力,並阻礙研究者、非營利組織、文化遺產機構及教育者等公共利益行為者的存取。建議原則包括不將付費爬取設為預設選項、避免一刀切規則、允許限流而非完全封鎖、並保留公共利益存取。系統應具備開放性、互操作性及標準化元件。除 Cloudflare 外,Microsoft 也在建構出版商 AI 市場,小型起點如 ProRata.ai 和 TollBit 亦在投入。RSL Collective 推出了名為 Really Simple Licensing(RSL)的新標準規範爬蟲存取範圍,Cloudflare、Akamai 和 Fastly 已採用此標準,並獲得 Yahoo、Ziff Davis 和 O'Reilly Media 等支援。知識共享亦支援 RSL,並與 CC signals 共同推動開發 AI 時代的技術與工具。
-
Grok誤傳邦迪海灘槍擊案關鍵資訊
由埃隆·馬斯克旗下的 xAI 開發並在其社交平臺 X 上廣為流傳的聊天機器人 Grok,被指多次在關於澳洲邦迪海灘今日大規模槍擊事件的報導中散播錯誤資訊。Gizmodo 指出,Grok 在多個貼文中誤認了制服其中一名槍手的旁觀者——43 歲的艾哈邁德·艾哈邁德(Ahmed al Ahmed),並質疑捕捉其行動的影片與照片真實性。其中一篇貼文將照片中的人物誤辨為以色列人質,另一篇則提及以色列軍隊對待巴勒斯坦人的相關無關資訊。此外,Grok 還聲稱一名名為愛德華·克拉布特裡(Edward Crabtree)的 43 歲資訊技術專業人員與高階解決方案架構師才是實際制服槍手的人員。儘管如此,Grok 似乎正在修正部分錯誤。至少有一篇聲稱槍擊現場影片實際顯示的是「艾爾弗雷德颶風」的貼文,在重新評估後已被更正。聊天機器人隨後承認了艾哈邁德的真實身份,並表示「誤解源於病毒式傳播的貼文錯誤地將他辨為愛德華·克拉布特裡,可能是由於報導錯誤或參考某個虛構角色的玩笑」。相關文章發表於一個功能大受限制的新聞網站,該網站可能由 AI 生成。