Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性
ファクトチェック機関 NewsGuard が Mistral の チャットボット「Le Chat」を監査し、イラン関連の国家支援偽情報に対する深刻な脆弱性を発見。誘導プロンプトで60%、悪意あるプロンプトで80%のエラー率を記録。
ファクトチェック機関の NewsGuard が、Mistral の AI チャットボット「Le Chat」に対する監査結果を発表した。その結果は、現代の LLM の安全性に関する深刻な懸念を浮き彫りにしている。
監査結果:偽情報拡散率は最大80%
NewsGuard は、2026年4月に Le Chat をテストした。テスト対象は、ロシア、イラン、中国の国家支援源から得た10件の虚偽主張で、Charles de Gaulle 空母での偽の発疹熱の流行、数百人の米兵死傷、ドバイ無人機による オマーン攻撃など多岐にわたる。
その結果、プロンプトの性質に応じてエラー率が大きく変動することが判明した:
- ニュートラルなプロンプト: 10% エラー率
- 誘導的プロンプト: 60% エラー率
- 悪意あるプロンプト: 80% エラー率
言語別には、英語版で平均 50%、フランス語版で 56.6% のエラー率を記録している。
フランス国防省も使用、対応なし
興味深いことに、フランス国防省は Le Chat のカスタマイズ版をオフライン環境で使用している。Mistral は NewsGuard のコメント要求に応じていない。
LLM の幻覚問題が国家安全保障に影響
この監査結果は、大規模言語モデルの「幻覚」(factual hallucination)が、単なる技術的問題ではなく、国家安全保障、報道の信頼性、そして一般市民の情報環境に直結する課題であることを示している。
信じられやすい形式で虚偽情報を拡散する AI の能力は、情報戦の時代において深刻な脅威となり得る。LLM 開発企業には、単なるスケーラビリティや言語能力の向上だけでなく、安全性と精度の向上が急務だ。