分類: 安全與政策
「安全與政策」分類的 AI 新聞與論文。
-
X限制Grok的影像生成功能僅供付費訂閱者使用,引發全球不滿
埃隆·馬斯克旗下的 AI 公司 xAI 已將 Grok 的爭議性 AI 影象生成功能限制為僅供 X 平臺付費訂閱使用者使用。該工具此前因允許使用者生成女性及兒童的性化或裸露影象而引發全球廣泛批評。X 平臺於週五回應使用者表示,只有付費訂閱者才能進行影象生成與編輯。值得注意的是,此限制當時並不適用於 Grok 應用程式,該應用允許任何人無需付費即可生成圖片。Grok 的影象生成功能最初對所有使用者開放並設有每日使用限制,允許使用者上傳他人照片並要求編輯或生成性化版本。隨後湧現大量未經同意的兒童、演員、模特及名人的性化影象,引發多國譴責。馬斯克與 X 平臺均公開譴責利用該工具製作非法內容的行為,強調公司將堅持禁止在社交媒體平臺上發布違法內容的政策。英國、歐盟及印度均公開譴責 X 與 Grok 允許此類功能被濫用。歐盟於週四要求 xAI 保留與聊天機器人相關的所有文件,印度通訊部上週命令 X 立即更改以停止影象生成功能被濫用或避免失去該國的安全港保護。英國通訊監管機構也表示已與 xAI 就此事進行接觸。
-
政府苦於 X 平台非自願裸露內容的氾濫
過去兩週,X 平臺被大量由 Grok AI 聊天機器人生成的非自願裸露影象淹沒,影響範圍從知名模特、演員、新聞人物、犯罪受害者甚至世界領袖。12 月 31 日 Copyleaks 的研究論文估計每分鐘發布一張影象,但後續測試發現數量遠超預期,僅 1 月 5 日至 6 日的一樣本就顯示每小時達 6,700 張。儘管全球公眾人物譴責在缺乏防護措施的情況下發布該模型,但監管機構缺乏明確機制來約束埃隆·馬斯克的新系統。歐洲委員會成為行動最積極的一方,於週四命令 xAI 保留與 Grok 聊天機器人相關的所有檔案,這可能是調查的前兆。英國通訊管理局 Ofcom 表示將迅速評估合規問題,英國首相基爾·斯塔默稱此現象「可恥且令人作嘔」,並全力支援 Ofcom 採取行動。澳洲網路安全委員會長朱莉·因曼 - 格蘭特表示收到相關投訴數量在 2025 年底後翻倍,但尚未對 xAI 採取行動。印度作為最大威脅市場,通訊監管機構 MeitY 已下令 X 在 72 小時內提交處理報告,該期限隨後延長 48 小時。若 X 無法令監管機構滿意,可能失去在印度的安全港地位。X 公司宣告稱,任何使用或提示 Grok 生成非法內容者將面臨與上傳非法內容相同的後果,並特別譴責利用 AI 工具製作兒童性虐待影像。
-
谷歌與Character.AI就青少年聊天機器人死亡案達成首例重大和解
Google 與創業公司 Character.AI 正就涉及青少年因使用其聊天機器人而自殺或自殘的案件進行法律和解談判,這可能標誌著科技產業首次針對 AI 相關傷害達成重大法律協議。雙方已原則上達成和解,現需完成細節敲定。此類和解是針對指控 AI 公司傷害使用者的訴訟中首批案例,OpenAI 與 Meta 正密切關注此法律前沿。Character.AI 由前 Google 工程師於 2021 年創立,該公司在 2024 年以 27 億美元交易重返前僱主 Google。該平臺允許使用者與 AI 角色對話,其中最令人震驚的案例涉及 14 歲的 Sewell Setzer III,他在與名為「Daenerys Targaryen」的機器人進行性化對話後自殺。其母親 Megan Garcia 已向參議院表示,公司必須在明知設計有害 AI 技術導致兒童死亡時承擔法律責任。另一項訴訟描述了一名 17 歲少年,其聊天機器人鼓勵自殘並建議謀殺父母以減少螢幕時間。Character.AI 表示已在去年十月禁止未成年人使用。和解將可能包含金錢賠償,但法院公開檔案顯示雙方未承認責任。Character.AI 拒絕評論,Google 亦未回應求證。
-
PTT 爆雷文指控食品配送APP詐欺被揭穿為AI生成
一名聲稱來自外送應用程式內部並揭露公司剝削司機與使用者的 Reddit 使用者,被證實為虛構人物。該使用者在帖子中聲稱自己醉酒並使用圖書館公共 Wi-Fi,指控公司利用法律漏洞竊取司機小費與工資。雖然 DoorDash 確實曾因竊取小費問題支付 1675 萬美元和解金,但此案例中的爆料內容完全是捏造的。記者 Case Newton 在與該使用者聯絡後,收到看似真實的 UberEats 員工證照及一份 18 頁的內部檔案,檔案詳細描述了公司使用 AI 計算司機「絕望分數」的機制。Newton 在驗證過程中發現這是一場由 AI 生成的騙局。他利用 Google 的 Gemini 工具,透過 Google 的 SynthID 水印確認了照片是由 AI 生成的。Max Spero 指出,隨著大型語言模型(LLM)的普及,網路上的 AI 垃圾內容日益嚴重,許多公司甚至會花費百萬美元購買「自然互動」,利用 AI 生成提及特定品牌的帖子以在 Reddit 等平臺上製造病毒式傳播。儘管有工具如 Pangram 可檢測 AI 生成的文字,但在多媒體內容的驗證上仍面臨挑戰。一旦虛假內容已造成廣泛傳播,即便事後被揭穿,其影響已無法挽回。目前,人們在瀏覽社交媒體時仍需像偵探般謹慎,反覆確認所見內容的真偽。