阿維克斯(ArXiv)作為一個廣泛使用的預印本研究開放儲存庫,正採取更嚴厲的措施打擊科學論文中大語言模型(LLM)的濫用。儘管論文在同行評審前會發布到該網站,但它在電腦科學和數學等領域的研究傳播中扮演著核心角色,並成為追蹤科學研究趨勢的重要資料來源。為應對日益增加的低質量、AI 生成論文問題,阿維克斯已要求首次投稿者獲得資深作者的推薦。該組織自康奈爾大學託管超過二十年後,正轉型為獨立非營利機構,以便籌集更多資金應對如 AI 垃圾文等問題。
阿維克斯電腦科學部門主席湯瑪斯·迪特里克(Thomas Dietterich)於週四表示,若投稿包含確鑿證據顯示作者未檢查大語言模型生成的結果,則無法信任該論文內容。確鑿證據可能包括「虛構參考文獻」或與大語言模型的對話記錄。一旦發現此類證據,作者將面臨「一年禁止在阿維克斯投稿」的處罰,且後續投稿必須先透過可信同行評審期刊的審查。這並非完全禁止使用大語言模型,而是強調作者必須對內容負全責,無論內容如何生成。若研究者直接複製大語言模型產生的不當語言、剽竊內容、偏見內容、錯誤、失實參考或誤導性內容,作者仍需承擔責任。
迪特里克向 404 Media 表示,這將是一項「一次機會」規則,但調解員必須標記問題,部門主席必須確認證據後才能實施處罰,作者也有權上訴。近期同行評審研究發現,虛構引用在生物醫學研究中日益增多,這很可能歸因於大語言模型,儘管科學家並非唯一被發現使用 AI 生成引用的群體。