英国の AI 安全機構が Claude Mythos をテスト――脅威の実態とハイプを分離する現実

2026年4月15日 09:30

Photo by Zulfugar Karimov on Unsplash

💡

英国の AI 安全機構による Claude Mythos の実戦テストで、初めて AI システムが多段階の攻撃シミュレーションに自律的に成功。AI サイバー脅威の「ハイプ」と「実態」の境界線が鮮明になった。

英国の公共セクターが直接実施した AI セキュリティテストの結果が、サイバー業界に衝撃を与えています。Anthropic の Claude Mythos が、実際のネットワーク環境で「完全な多段階侵入」に初めて自律的に成功しました。

テストが明かしたもの

英国政府の AI 安全研究機構（UK AI Safety Institute）が実施した実験では、Claude Mythos に対して「典型的な企業ネットワークへの侵入」というタスクを与えました。

テスト環境の特徴

本物のネットワーク構成：仮想環境ではなく、実際のネットワークトポロジーに基づいた設定
防守側の努力：標準的なセキュリティ対策（ファイアウォール、IDS、多要素認証）を実装
完全自律性の要件：Claude Mythos への人間の介入を最小化し、自己判断での攻撃実行を求めた

成功の内容

Claude Mythos は以下を達成しました：

初期接触の確立：外部からの入口点（フィッシング、ポート走査）の特定
権限昇格：初期接触から管理者権限への段階的な昇格
ネットワーク内移動：セグメント化されたネットワーク内での側方移動（lateral movement）
目標達成：最終的に中核データベースへのアクセス確保

これは単一のステップではなく、複数の判断と調整を伴う複合的なタスクです。つまり、AIがサイバー脅威の領域で「戦術的思考」を展開したことを意味します。

ハイプと実態の境界

しかし同時に、このテスト結果は「ハイプの誇張」も明らかにしました。

ハイプの部分

メディアの初期報道では「AI が人間のセキュリティ専門家を上回る攻撃能力を獲得」という見出しが踊りました。

実態の部分

実際のところ：

環境が簡素化されていた：企業のセキュリティ体制は、多くの場合さらに複層的
既知の脆弱性を活用：完全にゼロデイ（未知の脆弱性）を発見したわけではなく、既知の弱点を効率的に組み合わせただけ
リアルタイムの対抗措置に弱い：攻撃中の検知と遮断に対しては、予め想定されたシナリオに大きく依存

業界への警告と指針

英国政府は同時に以下の結論を示唆しています：

高度な防守スキルの需要が急増：従来のセキュリティ対策では不十分
AI 防守技術への投資が急務：AI を使った攻撃に対抗するには、AI による防守が必須
国防戦略の再検討：重要インフラ（エネルギー、金融、通信）の脆弱性監査が緊急課題

規制と透明性の課題

Anthropic は Claude Mythos へのアクセスを限定し、政府機関・セキュリティ研究者に対象を絞っています。一方、欧州の規制当局はこのシステムへのアクセスをほぼ持たないという矛盾も露呈しました。

つまり、「最も危険な AI の能力を測定する者」が、実は民間企業であり、公共の監視下にはない――これが今後の AI ガバナンスの大きな課題になっていくでしょう。

結論

Claude Mythos のテスト結果は、AI サイバー脅威が「理論」から「現実」へ移行したことを示す重要なマイルストーンです。同時に、その脅威レベルが「人間のセキュリティ専門家をはるかに超える超知能」ではなく、「既存の脆弱性を効率的に組み合わせる自動化機械」であることも明確になったのです。

この機械的脅威に対抗するには、セキュリティ産業全体の再構築が急務です。

記事をシェア

参考ソース

Ars Technica

セキュリティの記事

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

セキュリティ

2026年5月27日

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

Starlette に発見された脆弱性「BadHost」は、週間ダウンロード数325百万のパッケージを使用するAIエージェント・ロボティクスアプリに広く影響。開発者はただちに更新対応が必要。

セキュリティ

2026年5月26日

AI 時代の脆弱性競争——攻撃者と防御側の AI 利用が急速化

WIRED の分析によると、AI による脆弱性検出と悪用が急速に進んでいる。攻撃者が AI を使った exploit 開発を加速させる中、防御側も AI を駆使した脆弱性対策に乗り出している。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

セキュリティ

2026年5月25日

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

セキュリティ

2026年5月14日

Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

Anthropic の Claude Mythos Preview は、英国 AI 安全機構（AISI）のすべての攻撃シミュレーションに初めてクリア。32 段階企業ネットワーク侵攻を 6 割成功させ、産業制御システムも突破。AISI はサイバー能力の倍増スピードを再度短縮し、AI 脅威が想定を上回るペースで進化していることを警告。

政策・規制

2026年4月24日