生物醫學論文驚現大量虛假引用，學術誠信面臨嚴峻考驗

一項針對 250 萬篇生物醫學領域學術論文的審計發現，近 3000 篇論文包含無法追溯至已知出版物的虛假引用。研究顯示，此類造假引用問題正快速惡化，2025 年的相關論文數量是 2023 年的 12 倍。專家認為，這僅是冰山一角，並可能與生成式 AI 的發展有關。此現象尤其在綜述性文章中更為普遍，可能影響臨床指南，對學術誠信和科學研究的可靠性構成嚴重威脅。

值得注意此研究揭示學術界嚴重且日益嚴重的造假引用問題，直接衝擊科學研究的可靠性與學術誠信，影響廣泛。

一項對 250 萬篇學術論文進行的審計，已識別出近 3,000 篇生物醫學領域的論文包含虛假引用——這些引用無法追溯至已知出版物。

這項發表於《刺胳針》（The Lancet）的發現，是首個估計生物醫學文獻中虛假引用規模的學術研究。

研究作者設計了一個自動化流程，篩選了發表於 2023 年 1 月至 2026 年 2 月期間的 PubMed Central（一個公開存取的生物醫學文章資料庫）論文。

他們的研究表明，生物醫學領域論文中摻雜虛假引用的問題正在迅速惡化。2025 年的虛假引用論文數量是 2023 年的 12 倍（見「虛假引用呈上升趨勢」）。

研究共同作者、紐約哥倫比亞大學 AI 研究員 Maxim Topaz 表示，這些發現是「保守的低估」。「我們識別出的只是真實普遍性的下限。我們只是觸及了冰山一角。」他補充道。

總部位於倫敦的 Digital Science 公司科學計量學總監 Kathryn Weber-Boer 表示同意。她說，這項研究是「對該問題的紮實初步貢獻」。（Digital Science 由 Holtzbrinck Publishing Group 營運，該集團是《自然》雜誌出版商 Springer Nature 的大股東。《自然》新聞團隊在編輯上獨立於其出版商。）

《自然》雜誌在 4 月發表的一項分析估計，2025 年約有 1.6% 的出版物包含至少一個似乎不存在的出版物的參考引用。

在他們的研究中，Topaz 和他的同事開發了一個系統，檢查了 250 萬篇論文引用的 1.256 億個參考文獻。他們將分析重點放在具有有效數位物件識別碼（DOI）——由出版商和預印本儲存庫分配的獨特字母和數字字串——或由 PubMed 資料庫分配的 ID 的 9700 萬個參考文獻上。

他們使用大型語言模型（LLMs）來標記每個參考文獻中的文章標題與其 DOI 或 PubMed ID 所指向的論文標題之間的差異。他們還在四個學術資料庫：PubMed、Crossref、OpenAlex 和 Google Scholar 中搜尋了這些參考文獻。如果一個參考文獻的標題在這些資料庫中均未出現，該團隊就認為它是偽造的。

幻覺式引用正在污染科學文獻。該怎麼辦？

分析發現，有 2,564 篇論文包含一到兩個虛假引用，另有 246 篇論文包含三個或更多虛假引用。

Weber-Boer 說：「無論它們是由電腦還是由人類偽造的，這仍然是一個懸而未決的問題。」但她補充說，「問題的增長表明存在生成式 AI 的成分。」

在對 500 個標記的引用進行的 આ manual 檢查中，三名獨立審查員在十分之七的案例中確認了引用的偽造性。

然而，該分析可能低估了包含虛假引用的論文總數。「Google Scholar 並不是一個可靠的來源」來驗證引用，Weber-Boer 指出，因為一些虛假引用確實出現在該網站上，但卻無法追溯到真實的出版物。

Topaz 及其同事的分析顯示，綜述性文章的虛假引用比其他類型的文章多 57%。

Topaz 表示，有 28 項臨床試驗研究和 79 項系統性綜述包含此類引用，這些將「最終傳播到臨床指南中」。「這對我來說是最可怕的部分。」他補充道。

研究中標記的論文中只有 1.6% 被撤回或更正。但這些撤回是由於虛假引用以外的問題，而更正也沒有解決標記的引用問題。

研究人員能否阻止 AI 編造引用？

Topaz 說：「出版商應該在同行評審開始之前，將自動化引用驗證整合到投稿工作流程中。這些東西不應該讓同行評審者看到。」

匹茲堡卡內基梅隆大學電腦科學家 Nihar Shah 說：「我們作為研究社群應該思考的另一個問題是：隨著自主 AI 科學越來越受重視，人類在參與引用時的期望是什麼？」

「我們期望作者在多大程度上參與他們引用的論文？」

學術論文造假引用激增：250 萬篇生物醫學論文審計揭露近 3000 篇含虛假引用