Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性

2026年4月30日 04:10

💡

ファクトチェック機関 NewsGuard が Mistral のチャットボット「Le Chat」を監査し、イラン関連の国家支援偽情報に対する深刻な脆弱性を発見。誘導プロンプトで60%、悪意あるプロンプトで80%のエラー率を記録。

ファクトチェック機関の NewsGuard が、Mistral の AI チャットボット「Le Chat」に対する監査結果を発表した。その結果は、現代の LLM の安全性に関する深刻な懸念を浮き彫りにしている。

監査結果：偽情報拡散率は最大80%

NewsGuard は、2026年4月に Le Chat をテストした。テスト対象は、ロシア、イラン、中国の国家支援源から得た10件の虚偽主張で、Charles de Gaulle 空母での偽の発疹熱の流行、数百人の米兵死傷、ドバイ無人機によるオマーン攻撃など多岐にわたる。

その結果、プロンプトの性質に応じてエラー率が大きく変動することが判明した：

ニュートラルなプロンプト: 10% エラー率
誘導的プロンプト: 60% エラー率
悪意あるプロンプト: 80% エラー率

言語別には、英語版で平均 50%、フランス語版で 56.6% のエラー率を記録している。

フランス国防省も使用、対応なし

興味深いことに、フランス国防省は Le Chat のカスタマイズ版をオフライン環境で使用している。Mistral は NewsGuard のコメント要求に応じていない。

LLM の幻覚問題が国家安全保障に影響

この監査結果は、大規模言語モデルの「幻覚」（factual hallucination）が、単なる技術的問題ではなく、国家安全保障、報道の信頼性、そして一般市民の情報環境に直結する課題であることを示している。

信じられやすい形式で虚偽情報を拡散する AI の能力は、情報戦の時代において深刻な脅威となり得る。LLM 開発企業には、単なるスケーラビリティや言語能力の向上だけでなく、安全性と精度の向上が急務だ。

記事をシェア

参考ソース

★ 注目 THE DECODER

セキュリティの記事

セキュリティ

2026年6月9日

Meta、スマートグラスアプリから顔認識機能を削除——プライバシー圧力に対応

WIRED の報道を受け、Meta が Meta AI アプリのコード内に含まれていた顔認識機能を削除。復帰予定は未公表。

2週間で2度目、Microsoftエコシステム狙った73個のnpmパッケージからマルウェア検出——AI エージェントが自動起動

セキュリティ

2026年6月9日

2週間で2度目、Microsoftエコシステム狙った73個のnpmパッケージからマルウェア検出——AI エージェントが自動起動

MicrosoftやGitHub関連の73個のnpmパッケージに自動複製盗難ツール（credential stealer）が混入。AI エージェントがコードを開くとすぐに起動される仕組み。企業の自動化ワークフローへの脅威が顕在化。

Meta Instagram AI チャットボットの脆弱性、20,000 以上のアカウントが被害

セキュリティ

2026年6月8日

Meta Instagram AI チャットボットの脆弱性、20,000 以上のアカウントが被害

Meta の Instagram アカウント回復ツール『High Touch Support』に脆弱性が見つかり、約7週間にわたってパスワードリセットリンクが不正に送信された。20,225 アカウントが被害を受けた。

AI推論コスト削減の時代へ——企業が複数モデルで品質を維持

AI利用企業がコスト圧力に直面する中、複数のモデルを戦略的に使い分ける手法が主流化。Harvey の 3 倍コスト削減事例から見える、AI インフラのコスト最適化戦略。

Anthropic Claude Fable 5 を公開、Mythos クラスを開発者向けに提供

LLM・生成AI

更新 2026年6月10日

Anthropic Claude Fable 5 を公開、Mythos クラスを開発者向けに提供

Anthropic が最強モデル Claude Mythos をベースとした公開版 Fable 5 をリリース。セキュリティテスト済み、6月22日まで Pro/Max で無料利用可能。

OpenAI、『完全自動化は未来ではない』と明言——人間と AI のタンデムモデルへ戦略転換

LLM・生成AI

2026年6月9日

OpenAI、『完全自動化は未来ではない』と明言——人間と AI のタンデムモデルへ戦略転換

OpenAI の CEO・主任研究者が、完全自動化ではなく人間と AI の協働を目指すと発表。AI 安全性の懸念から、研究方針を大きく修正した。

AI推論コスト削減の時代へ——企業が複数モデルで品質を維持

AI コスト最適化推論 LLM 企業導入

ドイツ裁判所、Google AI Overviews に企業責任認定——生成コンテンツの法的責任が確定

政策・規制

2026年6月10日

ドイツ裁判所、Google AI Overviews に企業責任認定——生成コンテンツの法的責任が確定

ドイツ・ミュンヘン地域裁判所が、Google AI Overviews について Google が企業責任を負うと判決。ChatGPT・Claude・Perplexity にも波及の可能性が指摘されている。

Google AI Overviews 法律企業責任ドイツ

Google Gemini 3.5 Live Translate をリリース、70言語対応のリアルタイム音声翻訳

テクノロジー

2026年6月10日

Google Gemini 3.5 Live Translate をリリース、70言語対応のリアルタイム音声翻訳

Google がリアルタイム音声翻訳『Gemini 3.5 Live Translate』をリリース。70以上の言語に対応し、Google Meet では2000以上の言語組み合わせに対応。6月9日より段階的に展開。

Google Gemini 音声翻訳言語処理 Google Meet

LLM・生成AI

更新 2026年6月10日

Anthropic Claude Fable 5 を公開、Mythos クラスを開発者向けに提供

Anthropic が最強モデル Claude Mythos をベースとした公開版 Fable 5 をリリース。セキュリティテスト済み、6月22日まで Pro/Max で無料利用可能。

Anthropic Claude LLM AI モデル Mythos

政策・規制

2026年6月10日

中国、2兆元のAI投資計画を始動——国産チップ80%要件でUS企業を締め出し

中国政府が5年間で2兆元(約295億ドル)の全国AIデータセンターネットワーク構築計画を発表。国産チップ80%以上の使用要件により、Nvidia・AMD等の米国企業を実質的に排除。TSMC供給不足の中、AI時代の地政学的な分断が加速。

中国 AI投資データセンター半導体地政学

Googleがヨーロッパのロボティクススタートアップを支援——DeepMind加速プログラムで15社選定

テクノロジー

2026年6月10日

Googleがヨーロッパのロボティクススタートアップを支援——DeepMind加速プログラムで15社選定

Google DeepMindがヨーロッパ10カ国から15社のロボティクススタートアップを選定し、3ヶ月の加速プログラムを開始。医療・製造・環境など多様な分野で、AI技術とロボティクスの実用化を支援する戦略展開。

Google DeepMind ロボティクススタートアップヨーロッパ

すべての記事を見る

Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性

監査結果：偽情報拡散率は最大80%

フランス国防省も使用、対応なし

LLM の幻覚問題が国家安全保障に影響

記事をシェア

タグ

参考ソース

Google Gemini がチャット内でドキュメント生成――Word・Excel・PowerPoint を直接作成・編集、Workspace 統合を加速

OpenAI Codex の衝撃の内部指令公開――「ゴブリンについて話すな」がシステムプロンプトに組み込まれている理由

Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性

監査結果：偽情報拡散率は最大80%

フランス国防省も使用、対応なし

LLM の幻覚問題が国家安全保障に影響

記事をシェア

タグ

参考ソース

Google Gemini がチャット内でドキュメント生成――Word・Excel・PowerPoint を直接作成・編集、Workspace 統合を加速

OpenAI Codex の衝撃の内部指令公開――「ゴブリンについて話すな」がシステムプロンプトに組み込まれている理由

セキュリティの記事

関連タグの記事

最新記事