arXiv が AI 生成の虚偽引用に 1 年間の投稿禁止処置――『存在しない論文』記載が 10 倍増加
プレプリント・サーバー arXiv が、AI の幻覚(hallucination)による虚偽引用が含まれた論文提出者に対して 1 年間の投稿禁止処置を実施。2023 年以降、hallucinated citations は 10 倍に増加し、2026 年初期の論文の 0.36% に達していることが判明。
「存在しない論文」を引用する著者に厳罰
プレプリント・サーバー arXiv は、大型言語モデル(LLM)の幻覚(hallucination)によって虚偽引用が含まれた論文を投稿した著者に対して、1 年間の投稿禁止 を実施する新ポリシルを強化しました。arXiv Computer Science セクション の議長を務める Oregon State University の Thomas G. Dietterich 教授が、このポリシーの詳細を明かしました。
対象となる「AI スロップ」
投稿禁止の対象となる具体例:
- Hallucinated citations ― 実在しない論文への引用(最も一般的)
- LLM メタコメント ― 「以下は 200 語のサマリーです。変更を加えるかどうかをお知らせください」のような AI の会話的コメント
- プレースホルダーデータ ― 「実際の実験データをここに入力してください」といった不完成な数値
これらは論文の質を損なうだけでなく、査読プロセスそのものを破壊する行為として扱われます。
急増する虚偽引用:2023 年以降 10 倍
arXiv が危機感を持つ背景は、hallucinated citations の急速な増加です:
- 2023 年以降 : 10 倍に増加
- 2026 年初期 : 約 277 本に 1 本の割合で hallucinated citations を含む論文が投稿される状態(0.36%)
この数字は毎月増加し続けており、査読ボランティア(arXiv は査読者に報酬を払わない)の負担がさらに増す可能性があります。
1 年後の再投稿は「ピアレビュー必須」
投稿禁止期間終了後、これまで hallucinations を含めた著者による再投稿は、以下の厳しい条件が課せられます:
すべての将来の arXiv 投稿は、まず同じ分野の査読済みジャーナルまたはカンファレンスに採択されなければならない
つまり、arXiv への直接投稿(preprint)ができず、査読を経た論文のみ可能になります。これは研究者の「論文公開の自由」を実質的に制限するもので、かなり厳しい措置です。
「著者責任」と見なす、技術ではなく倫理の問題
arXiv の公式声明では、この対応を「技術問題ではなく 著者の責任問題」と位置付けています。LLM の性質上、完全に hallucinations を排除することは不可能ですが、著者は以下の責任を問われます:
- 投稿前に LLM 生成内容の完全性を検証するプロセスの欠落
- AI ツール使用に関する記載の不正確さ
学術コミュニティへの波紋
arXiv のような大型プレプリント・サーバーの規制強化は、ICLR 2026 などの主要カンファレンスでも同様の対策が講じられる可能性を示唆しています。研究者は「AI 便利ツール」として LLM を使用する際に、質保証(fact-check)プロセルの再設計が急務となっています。