ArXiv 將禁止作者一年，若他們讓 AI 做所有工作

阿維克斯（ArXiv）作為一個廣泛使用的預印本研究開放儲存庫，正採取更嚴厲的措施打擊科學論文中大語言模型（LLM）的濫用。儘管論文在同行評審前會發布到該網站，但它在電腦科學和數學等領域的研究傳播中扮演著核心角色，並成為追蹤科學研究趨勢的重要資料來源。為應對日益增加的低質量、AI 生成論文問題，阿維克斯已要求首次投稿者獲得資深作者的推薦。該組織自康奈爾大學託管超過二十年後，正轉型為獨立非營利機構，以便籌集更多資金應對如 AI 垃圾文等問題。

阿維克斯電腦科學部門主席湯瑪斯·迪特里克（Thomas Dietterich）於週四表示，若投稿包含確鑿證據顯示作者未檢查大語言模型生成的結果，則無法信任該論文內容。確鑿證據可能包括「虛構參考文獻」或與大語言模型的對話記錄。一旦發現此類證據，作者將面臨「一年禁止在阿維克斯投稿」的處罰，且後續投稿必須先透過可信同行評審期刊的審查。這並非完全禁止使用大語言模型，而是強調作者必須對內容負全責，無論內容如何生成。若研究者直接複製大語言模型產生的不當語言、剽竊內容、偏見內容、錯誤、失實參考或誤導性內容，作者仍需承擔責任。

迪特里克向 404 Media 表示，這將是一項「一次機會」規則，但調解員必須標記問題，部門主席必須確認證據後才能實施處罰，作者也有權上訴。近期同行評審研究發現，虛構引用在生物醫學研究中日益增多，這很可能歸因於大語言模型，儘管科學家並非唯一被發現使用 AI 生成引用的群體。