學術預印本平台 ArXiv 正採取新措施,試圖減少充斥 AI 生成低品質內容(AI slop)的論文數量。

根據 ArXiv 電腦科學部門主席 Thomas Dietterich 表示,如果論文出現「作者未檢查大型語言模型(LLM)生成結果的無法辯駁證據」,例如虛構的參考文獻或 LLM 的「中繼註解」,作者將被禁止使用 ArXiv 一年。未來的 ArXiv 投稿也必須先被「信譽良好的同行評審機構」接受。

ArXiv 的行為準則指出,簽署論文作者姓名即表示每位作者對其所有內容負全責,無論內容如何生成。

如果生成式 AI 工具產生不當語言、抄襲內容、帶有偏見的內容、錯誤、不正確的參考文獻或誤導性內容,並被納入科學著作中,作者應負起責任。

我們最近已澄清相關的處罰措施。如果投稿包含作者未檢查 LLM 生成結果的無法辯駁證據,這意味著我們無法信任論文中的任何內容。

處罰為禁止使用 arXiv 一年,之後的投稿必須先被信譽良好的同行評審機構接受。

無法辯駁證據的例子包括:虛構的參考文獻、LLM 的中繼註解(例如:「這裡有 200 字的摘要;您想讓我做任何修改嗎?」;「此表格中的數據僅為示意,請填入您實驗的實際數字」)。

Dietterich 告訴 404Media,作者可以對禁令決定提出申訴。他也指出,這項政策僅適用於「無法辯駁的證據案例」,且「我們的內部流程要求先由版主記錄問題,然後由部門主席確認後才能施加處罰」。

去年,ArXiv 也更新了政策,以減少 AI 生成的低品質內容,規定只有經過同行評審並被會議或期刊接受的電腦科學評論文章和立場文件才能發表。當時 ArXiv 表示:「大型語言模型的出現使得這類內容相對容易按需產出,而我們收到的絕大多數評論文章,不過是帶註解的書目,缺乏對開放研究問題的實質性討論。」

ArXiv 將禁止上傳充斥 AI 生成內容的研究人員ArXiv 將禁止上傳充斥 AI 生成內容的研究人員ArXiv 將禁止上傳充斥 AI 生成內容的研究人員ArXiv 將禁止上傳充斥 AI 生成內容的研究人員ArXiv 將禁止上傳充斥 AI 生成內容的研究人員ArXiv 將禁止上傳充斥 AI 生成內容的研究人員