一項對 250 萬篇學術論文進行的審計,已識別出近 3,000 篇生物醫學領域的論文包含虛假引用——這些引用無法追溯至已知出版物。

這項發表於《刺胳針》(The Lancet)的發現,是首個估計生物醫學文獻中虛假引用規模的學術研究。

研究作者設計了一個自動化流程,篩選了發表於 2023 年 1 月至 2026 年 2 月期間的 PubMed Central(一個公開存取的生物醫學文章資料庫)論文。

他們的研究表明,生物醫學領域論文中摻雜虛假引用的問題正在迅速惡化。2025 年的虛假引用論文數量是 2023 年的 12 倍(見「虛假引用呈上升趨勢」)。

研究共同作者、紐約哥倫比亞大學 AI 研究員 Maxim Topaz 表示,這些發現是「保守的低估」。「我們識別出的只是真實普遍性的下限。我們只是觸及了冰山一角。」他補充道。

總部位於倫敦的 Digital Science 公司科學計量學總監 Kathryn Weber-Boer 表示同意。她說,這項研究是「對該問題的紮實初步貢獻」。(Digital Science 由 Holtzbrinck Publishing Group 營運,該集團是《自然》雜誌出版商 Springer Nature 的大股東。《自然》新聞團隊在編輯上獨立於其出版商。)

《自然》雜誌在 4 月發表的一項分析估計,2025 年約有 1.6% 的出版物包含至少一個似乎不存在的出版物的參考引用。

在他們的研究中,Topaz 和他的同事開發了一個系統,檢查了 250 萬篇論文引用的 1.256 億個參考文獻。他們將分析重點放在具有有效數位物件識別碼(DOI)——由出版商和預印本儲存庫分配的獨特字母和數字字串——或由 PubMed 資料庫分配的 ID 的 9700 萬個參考文獻上。

他們使用大型語言模型(LLMs)來標記每個參考文獻中的文章標題與其 DOI 或 PubMed ID 所指向的論文標題之間的差異。他們還在四個學術資料庫:PubMed、Crossref、OpenAlex 和 Google Scholar 中搜尋了這些參考文獻。如果一個參考文獻的標題在這些資料庫中均未出現,該團隊就認為它是偽造的。

幻覺式引用正在污染科學文獻。該怎麼辦?

分析發現,有 2,564 篇論文包含一到兩個虛假引用,另有 246 篇論文包含三個或更多虛假引用。

Weber-Boer 說:「無論它們是由電腦還是由人類偽造的,這仍然是一個懸而未決的問題。」但她補充說,「問題的增長表明存在生成式 AI 的成分。」

在對 500 個標記的引用進行的 આ manual 檢查中,三名獨立審查員在十分之七的案例中確認了引用的偽造性。

然而,該分析可能低估了包含虛假引用的論文總數。「Google Scholar 並不是一個可靠的來源」來驗證引用,Weber-Boer 指出,因為一些虛假引用確實出現在該網站上,但卻無法追溯到真實的出版物。

Topaz 及其同事的分析顯示,綜述性文章的虛假引用比其他類型的文章多 57%。

Topaz 表示,有 28 項臨床試驗研究和 79 項系統性綜述包含此類引用,這些將「最終傳播到臨床指南中」。「這對我來說是最可怕的部分。」他補充道。

研究中標記的論文中只有 1.6% 被撤回或更正。但這些撤回是由於虛假引用以外的問題,而更正也沒有解決標記的引用問題。

研究人員能否阻止 AI 編造引用?

Topaz 說:「出版商應該在同行評審開始之前,將自動化引用驗證整合到投稿工作流程中。這些東西不應該讓同行評審者看到。」

匹茲堡卡內基梅隆大學電腦科學家 Nihar Shah 說:「我們作為研究社群應該思考的另一個問題是:隨著自主 AI 科學越來越受重視,人類在參與引用時的期望是什麼?」

「我們期望作者在多大程度上參與他們引用的論文?」

學術論文造假引用激增:250 萬篇生物醫學論文審計揭露近 3000 篇含虛假引用學術論文造假引用激增:250 萬篇生物醫學論文審計揭露近 3000 篇含虛假引用學術論文造假引用激增:250 萬篇生物醫學論文審計揭露近 3000 篇含虛假引用學術論文造假引用激增:250 萬篇生物醫學論文審計揭露近 3000 篇含虛假引用學術論文造假引用激增:250 萬篇生物醫學論文審計揭露近 3000 篇含虛假引用學術論文造假引用激增:250 萬篇生物醫學論文審計揭露近 3000 篇含虛假引用