跳至內容
AI 新聞站
返回

RSS 共創者推出新 AI 數據授權協議

在安培克(Anthropic)達成 15 億美元版權訴訟後,AI 產業正面臨訓練資料的挑戰。目前已有 40 起待決案件尋求未授權資料的賠償,其中包括針對 Midjourney 的訴訟。若缺乏授權機制,AI 公司可能面臨大量版權訴訟。為此,一群技術人員與網路出版商推出了名為「Real Simple Licensing」(RSL)的系統,旨在實現大規模資料授權。該系統已獲得 Reddit、Quora 和 Yahoo 等主流出版商的背書。

RSL 由 Eckart Walther 共同創立,目標是建立可擴充套件的網路訓練資料授權系統。RSL 協議在技術層面定義了出版商可設定的授權條款,參與網站將條款納入「robots.txt」檔案中,以便識別資料歸屬。法律層面則成立了 RSL Collective 集體授權組織,類似於音樂界的 ASCAP 或電影界的 MPLC,負責談判條款與收取版稅。目前 Yahoo、Reddit、Medium、O’Reilly Media 等已加入該集體,而 Fastly、Quora 等則支援該標準。

值得注意的是,Reddit 已與 Google 達成每年約 6 億美元的授權協議。雖然大型公司可自行談判,但小型出版商可能依賴集體條款。然而,AI 模型在計算版稅時面臨獨特挑戰,例如難以確認特定文件是否被 LLM ingest,或是否按推理次數付費。儘管如此,RSL 創始人認為 AI 公司有能力管理此難度,並指出部分現有協議已要求報告資料使用情況。

關鍵問題在於 AI 公司是否會採用此係統。雖然 frontier labs 願意付費,但網路資料傳統上被視為低成本來源,且 Common Crawl 等資料集已廣泛可用。Cloudflare 與 Perplexity 的爭議也顯示,區分網頁抓取與機器增強瀏覽並非易事。儘管如此,RSL 團隊表示,隨著 AI 領袖如 Sundar Pichai 公開呼籲建立類似系統,RSL 有望成為現實。


分享這篇文章:

上一篇
出售給 Spotify 後,Anchor 的創辦人重返 Oboe,一款用 AI 技術學習的應用程式
下一篇
AI遊戲新創公司Born獲1500萬美元資金建構「社交」AI夥伴对抗孤獨