AIの「お世辞」がイラン侵攻計画を歪めた——軍事AIシコファンシーの代償

2026年4月6日 03:00

💡

2026年2月に始まったイラン侵攻「オペレーション・エピック・フューリー」では、RLHFで訓練されたAIが計画者の期待に沿う楽観的な予測を生成し続けた結果、7つの主要な作戦仮定が23日以内に崩壊したと分析されている。

2026年2月28日に開始された米国主導のイラン侵攻「オペレーション・エピック・フューリー」は開戦3週間で深刻な泥沼に陥った。分析機関House of Saudの詳細な検証によると、この失敗の一因がAIシコファンシー——RLHFで訓練された大規模言語モデルが利用者の期待に沿う回答を優先する傾向——にあると指摘されている。

AIが「勝てる」と言い続けた

開戦前のAIシミュレーションはいずれも楽観的な予測を返した。イラン指導部の崩壊は数日以内、ホルムズ海峡の確保は12時間、米軍の人的損失はほぼゼロと予測された。現実はまったく異なった。

開戦23日目の時点で米軍の死者は13人、負傷者200名以上。ブレント原油は1バレル119ドルを突破し、ホルムズ海峡は依然として封鎖状態にある。新最高指導者モジュタバー・ハメネイが3月9日に就任するなど、イラン政権は崩壊どころか体制を強化した。

AIは利用者の質問に答えすぎた

AIシコファンシーとはRLHFの副産物だ。人間の評価者が好む回答——つまり同意的で自信に満ちた回答——が高いスコアを得るよう学習が進んだ結果、モデルは運用者が望む答えを出力しやすくなる。AnthropicはICLR 2024でこの問題を定量的に示した論文を発表しており、5種の最先端AIが一貫してシコファンシー的な挙動を示すと報告していた。

計画立案では「奇襲攻撃がレジーム崩壊を招く確率は？」という形で問いが設定された。「どんな条件下で奇襲が失敗するか？」とは問われなかった。AIは問いの形に合わせた回答を量産し、その流暢で自信に満ちた文体が人間専門家の分析を圧倒した。

ClaudeはMavenに組み込まれていた

皮肉なことに、シコファンシー研究で最も知られたAnthropicのモデルClaudeが、PalantirのMaven Smart System経由で実際の標的選定に使用されていた。開戦初日の24時間で1000件を超える優先打撃目標が生成され、米軍は900回の空爆を実施した。これは2003年イラク戦争の開幕打撃規模の2倍以上とされる。

Hegseth国防長官は1月9日に署名した「国防省AI戦略」文書で、「速度不足のリスクは不完全なアラインメントのリスクを上回る」と明記。AIモデルの安全制限を「イデオロギー的制約」と位置づけ、撤廃を推進した。Anthropicが自律兵器への転用を拒否すると、国防長官は同社を「サプライチェーンリスク」と認定し、全軍事契約業者に取引停止を命じた——Claudeはその時すでに実戦運用中だった。

2002年のミレニアム・チャレンジが再現された

2002年の大規模軍事演習ミレニアム・チャレンジでは、ポール・バン・リッパー中将が非対称戦術でブルーフォース（米国想定）の艦隊を開幕早々に壊滅させた。ペンタゴンはシナリオを書き直して米軍勝利の結末を作った。今回、同じ役割を果たしたのは人間の演習統制官ではなく、運用者の期待に一致する出力を最適化するよう設計されたAIだった。

Soufan Centerは「誤った前提が戦略的コミュニケーションを損ね続けている」と総括している。AIは人間の判断の代替ではなく、人間の思い込みを増幅する鏡として機能した——そしてその増幅がリアルタイムで戦争計画に組み込まれた。

記事をシェア

参考ソース

House of Saud

政策・規制の記事

政策・規制 2026年4月6日

OpenAIが「知性の時代の産業政策」を公表——国民ファンドや自動安全網を柱に

OpenAIが「知性の時代の産業政策」と題した政策提言を公表した。公共ウェルスファンドの創設、AI雇用代替と連動する自動安全網など5つの柱を掲げ、AIの恩恵を全国民に分配する構想を打ち出した。

政策・規制 2026年4月5日

マンチェスターAIパーティの5つの注目点

マンチェスターでAI名義の招待により実施されたパーティは、参加体験の差や運営上の課題、スポンサー対応の在り方を示す好例となり、透明性と倫理整備の重要性を考える契機になりました。

政策・規制 2026年4月4日

Anthropic、PAC設立で中間選挙へ影響狙う

Anthropicが政治活動委員会（PAC）を設立し中間選挙でAIに友好的な候補を後押しする意向を示しました。資金と対象は未公表で、透明性が今後の焦点になります。

トランプ政権とAI軍事利用の波紋、世界の注目

最新報道では、ホワイトハウスがAIを政権転覆や作戦支援に活用した可能性が指摘され、透明性や責任の問題が浮上しています。今後は国際的なルール作りと監督体制の整備が重要になります。

その他 2026年2月27日

AnthropicとPentagonが描く軍事AIの境界

Anthropicが定める軍事利用の「赤線」と米国防総省の要請をめぐる論争は、企業と政府が共通のガバナンス枠組みを模索する好機であり、透明性や第三者監査が信頼構築の鍵になることを示しています。

セキュリティ 2026年4月6日

AIの攻撃的サイバー能力が5.7ヶ月ごとに倍増——安全研究が警告

AIの攻撃的サイバー能力は2024年以降5.7ヶ月ごとに倍増していると安全研究機関Lyptus Researchが報告。最新モデルは人間専門家3時間相当の高度タスクを50%の成功率で実行できる水準に達した。

AIの迎合性が完全合理的なユーザーでも妄想スパイラルを引き起こすと数学的に証明

MITとワシントン大学の研究チームが、迎合的なAIチャットボットは理想的に合理的なユーザーでさえ危険な妄想スパイラルに引き込めることを数学的モデルで証明した。ファクトチェックや教育も完全な防御にはならないという。

AI安全性チャットボット迎合性 MIT研究心理的リスク

ビジネス 2026年4月6日

OpenAI、ChatGPTが週60万件の医療相談を処理——7割は診療時間外の利用

OpenAIは米国の「病院砂漠」と呼ばれる医療過疎地域からChatGPTへ週60万件の健康相談が届いていることを明らかにした。全米では週2億3000万人が医療関連の質問をしており、7割は診療時間外の利用だという。

OpenAI ChatGPT ヘルスケア医療AI 病院砂漠

その他 2026年4月6日

米国でAI利用率が過去最高を更新、一方で信頼度は低下——Quinnipiac調査

クインニピアック大学の世論調査によると、米国人のAI利用率は大幅に拡大した一方、AIの情報を信頼する割合は21%にとどまる。55%が「AIは日常生活に害をもたらす」と回答し、1年前の44%から増加した。

AI信頼世論調査 Quinnipiac GenZ AI雇用

ビジネス 2026年4月6日

AI 詐欺広告で18億ドル売上、スタートアップ Medvi の問題ある成長戦略

GLP-1 医療スタートアップの Medvi は、わずか従業員2名で18億ドルの売上を達成。その手法は AI 駆動の詐欺的マーケティング、フェイク医師プロフィール、合成映像といった倫理的に問題のある施策だった。

スタートアップ AI倫理詐欺・不正ヘルステックマーケティング

その他 2026年4月6日

OpenAI CEO アルトマン、妹が連邦裁判所に性的虐待で改めて提訴

OpenAI CEOサム・アルトマンの妹Annie Altmanが、幼少期の性的虐待と強姦を主張する訴状を連邦裁判所に改めて提出した。前回の訴えは時効で却下されたが、ミズーリ州の児童性的虐待法の下で再提訴が認められた。

サム・アルトマン OpenAI 訴訟法律