AI ハルシネーション引用、医学論文で急増——247万論文監査で捏造12倍増加、臨床ガイドラインの信頼性を脅かす
コロンビア大学ら国際研究チームが実施した247万論文監査で、言語モデル生成の虚偽引用が12倍以上に増加。特にレビュー論文での発生率が高く、医療ガイドラインの根拠が揺らぐ事態に。出版社の対応遅延が深刻化。
247万論文監査で明かされた「幻の引用」の急増
コロンビア大学とその他の国際研究機関が実施した大規模監査により、生成AIが生成する虚偽引用が医学・生物学論文で劇的に増加していることが明らかになりました。PubMed Central に登録された2023年1月~2026年2月発表の247万本の論文を検査した結果、約4,046件の捏造引用が検出されました。より深刻なのは、その増加率です。
引用捏造率の推移:
- 2023年通年:約400件/100万論文
- 2025年末:5,130件/100万論文
- 2026年初頭:5,690件/100万論文
この数字は、わずか2年で12倍以上の増加を意味しています。
なぜ虚偽引用が検出困難なのか
生成AIによる虚偽引用の厄介な点は、体裁が完璧なことです。研究チームが指摘する特徴は以下の通り:
- 論文のテーマに完全に合致した内容
- 正しい参考文献フォーマット(著者名、発行年、巻号、ページ数)
- 実在する研究者の名義を無断で使用
- 雑誌名・出版社名も実在するものを選別
つまり、目視で「参考文献リスト」をざっと眺めただけでは、虚偽と真実を区別することは極めて困難です。デジタルな「偽装品」は、物理的な偽造品よりも一層検出しづらい特性があります。
臨床ガイドラインへの直接的脅威
最も危機的なのは、捏造引用の被害がランダムではなく、特定の論文型に集中しているという点です。
レビュー論文への影響:
- レビュー論文の捏造引用率:他論文比で57%高い
- 理由:レビュー論文は100~500件の参考文献を列挙するため、個別検証が困難
医療・保健分野では、レビュー論文がガイドライン策定の根拠として用いられます。つまり、虚偽引用が混在したレビュー論文は、やがて臨床ガイドライン → 医療実践 → 患者治療という引用チェーンの中で増幅され、最終的には医療の質に影響を及ぼしうるのです。
出版社の対応遅延が問題をさらに深刻化
一層懸念される点は、検出されても放置されている状況です。
現状:
- 捏造引用が検出された論文のうち98.4%が、今なお出版社からの対応なし
- 平均対応期間:数ヶ月~1年以上の遅延
- 多くの論文は依然、検索エンジンやデータベースで「有効な参考資料」として流通中
出版社が迅速に対応できない背景には、①査読者・編集者の負担増加、②AI検出ツールの整備遅れ、③異議申し立てプロセスの複雑さなどがあります。
研究者・医療従事者ができること
この問題に直面した時、どう対応すべきか。
論文執筆者:
- 引用を自動生成ツールに依存しない
- 参考文献は必ず原典にあたる(引用管理ツールの確認作業を欠かさない)
医療従事者・臨床医:
- 医療ガイドラインを参照する際、その根拠論文の「引用元」を一度は確認する
- 疑わしい記載を見つけた場合、出版社・学会に報告
一般読者:
- 論文を信頼する一方、100%依存しない
- 重要な健康判断はガイドラインを参照する前に、医師に相談
学術出版の信頼回復が急務
このレポートは、単なる「AI問題」ではなく、学術コミュニティ全体の誠実性に関わる危機を示しています。大学、出版社、査読者、そして研究者が一体となって、引用チェーンの透明性を高め、AI時代の検証方法を確立する必要があります。