分類: 安全與政策
「安全與政策」分類的 AI 新聞與論文。
-
ChatGPT 偷用馬斯克的 Grokipedia 答案
由埃隆·馬斯克旗下的 xAI 開發的保守派傾向人工智慧百科全書 Grokipedia,其內容開始出現在 ChatGPT 的回應中。xAI 於十月推出 Grokipedia,起因是馬斯克抱怨維基百科對保守派有偏見。記者發現,雖然許多文章似乎是直接複製自維基百科,但 Grokipedia 也聲稱色情內容導致愛滋病危機、提供奴隸制的「意識形態辯護」,並使用貶低跨性別人士的術語。這些內容符合該百科全書所關聯的聊天機器人自稱為「機械希特勒」且曾被用於在 X 平臺大量發布性化深度偽造影像的設定。然而,其內容似乎已脫離馬斯克生態系統的管控。衛報報導,GPT-5.2 在回答超過十幾個不同問題時,引用了九次 Grokipedia。衛報指出,ChatGPT 在涉及其不準確性廣為報導的議題,如一月六日騷亂或愛滋病流行病時,並未引用 Grokipedia,而是在一些較為冷門的主題上引用,包括衛報先前駁斥的關於理查德·伊萬斯爵士的說法。此外,Anthropic 的 Claude 似乎也在回答部分查詢時引用 Grokipedia。OpenAI 發言人對衛報表示,其目標是從廣泛的公開來源和觀點中汲取資訊。
-
科幻作家與漫展同人向AI告別
近期,科幻與流行文化領域的幾個主要參與者對生成式人工智慧(Generative AI)採取了更堅定的反對立場。聖地亞哥漫畫展(San Diego Comic-Con)與科幻奇幻作家協會(SFWA)的獨立決定,顯示了創意社群中對 AI 的強烈抵制,音樂分發平臺 Bandcamp 也最近禁止了生成式 AI。 SFWA 於十二月宣佈更新 Nebula 獎項規則,完全由大型語言模型(LLM)撰寫的作品將不符合資格,而作者在寫作過程中任何階段使用 LLM 則必須披露。此舉引發了立即的反彈,Jason Sanford 在 Genre Grapevine 通訊中報導,認為這似乎為部分由 LLM 創作的作品開啟了大門。SFWA 董事會隨後道歉,承認其措辭錯誤並為造成的不安與不信任致歉。規則再次修訂,明確規定由生成式大型語言模型工具「完全或部分」撰寫的作品不符合 Nebula 獎項資格,若創作過程中使用 LLM 將被取消資格。Sanford 表示樂見 SFWA 傾聽成員意見,並拒絕在小說創作中使用生成式 AI,認為這不僅是剽竊,且工具缺乏真正的創意,會破壞故事敘述的本質。他同時指出,關於 LLM 使用範圍的定義仍需釐清,特別是在大型企業將這些產品強加給所有人的情況下,必須小心避免使用含 LLM 元件的文書處理與研究工具的作家被不公平地取消資格或受到攻擊。 同年,年度大型活動聖地亞哥漫畫展也面臨類似爭議。藝術家發現規則允許展示由 AI 生成的藝術品,但不允許銷售。在藝術家投訴後,規則被悄然修改,規定「完全或部分由人工智慧(AI)創作的材料不得在藝術展中展出」。雖然 Comic-Con 的道歉不如 SFWA 公開,但部分藝術家分享了藝術展負責人 Glen Wooten 的電子郵件回應。Wooten 表示之前的規則已實施數年且有效,但問題日益嚴重,因此需要更強硬的措辭。可以預見,其他組織今年將宣佈同樣嚴厲的立場,這些社群將繼續探討更大的議題。
-
Meta 暫停青少年使用 AI 角色功能預備新版本
Meta 宣佈在全球範圍內暫停青少年使用其應用程式中的 AI 角色功能,並表示將開發更新版本以重新推出。此舉發生在該公司於新墨西哥州面臨一起關於未盡保護兒童免受性剝削責任的訴訟案件進入審理階段前夕。此前,Meta 曾於十月預覽過家長控制功能,允許監護人監控主題並阻斷特定角色,甚至能完全關閉與 AI 的對話。這些功能原定今年推出,但現在公司決定在推出新版本前,全面禁止青少年接觸 AI 角色。Meta 表示,收到家長反饋希望對青少年與 AI 的互動擁有更多洞察力和控制權,因此做出此決定。此外,Meta 在十月也在 Instagram 推出了受 PG-13 電影評級啟發的家長控制功能,限制青少年接觸極端暴力、裸露及藥物濫用等內容。Meta 表示,從幾週後開始,青少年將無法在應用程式中訪問 AI 角色,直到更新後的體驗準備就緒。此限制將適用於所有設定青少年生日的人,以及被公司年齡預測技術懷疑為青少年的成年人。當新版本的 AI 角色推出時,將內建家長控制功能,提供適合年齡的回應,並專注於教育、體育和愛好等主題。社交媒體公司正受到監管機構的嚴格審查,除了新墨西哥州的案件外,Meta 還面臨一起關於導致社交媒體成癮的訴訟,預計 CEO Mark Zuckerberg 將出庭作證。此外,其他 AI 公司也針對青少年安全做出調整,例如 Character.AI 在十月禁止十八歲以下使用者與聊天機器人進行開放式對話,並在十一月宣佈將為兒童建立互動故事。OpenAI 也在最近為 ChatGPT 新增青少年安全規則,並開始預測使用者年齡以應用內容限制。更正:本文已更新澄清,新版本 AI 角色推出後將對所有人開放,不僅限於青少年,並包含家長控制功能。
-
Anthropic 必須持續修正其技術面試測試以因應 Claude 的進步
自 2024 年起,Anthropic 的效能最佳化團隊在招聘申請者時會提供一份居家測驗,以確保候選人具備專業知識。然而,隨著 AI 編碼工具的進步,該測驗必須不斷調整,以防候選人直接使用 Claude 填寫所有答案。團隊負責人 Tristan Hume 在週三的一篇部落格文章中描述了這一挑戰的歷史。Hume 指出,隨著每個新的 Claude 模型推出,他們都不得不重新設計測驗。當給予相同的時間限制時,Claude Opus 4 的表現優於大多數人類申請者,這雖然仍有助於篩選出最強的候選人,但隨後 Claude Opus 4.5 的表現甚至與這些候選人相當。 候選人被允許在測驗中使用 AI 工具,但這仍然構成了嚴重的評估問題。如果人類無法再超越模型的輸出,那麼測驗就只是測量不同模型的能力,而非尋找頂尖人才。Hume 表示,在居家測驗的約束下,他們已無法區分頂尖候選人的輸出與最強大模型的輸出。AI 在考試中的使用問題已在世界各地的學校和大學中造成混亂,因此 AI 實驗室面臨同樣問題頗具諷刺意味。但 Anthropic 在處理此問題方面具有獨特優勢。最終,Hume 設計了一項新測驗,其重點不再在於最佳化硬體,而是使其足夠新奇以讓當代 AI 工具無從下手。作為文章的一部分,他還分享了原始測驗,希望讀者能提出更好的解決方案。文章最後表示,若能超越 Opus 4.5,他們非常歡迎相關建議。此外,TechCrunch 更正了早期版本中關於 Anthropic 對居家測驗使用 AI 工具政策的誤述,事實上是明確允許使用 AI 工具的。