Anthropic セキュリティ研究が示す新たな脅威——AIは数時間でセキュリティパッチを悪用可能
Anthropic の研究が、大規模言語モデルが脆弱性パッチから悪用可能な状態を数時間で構築できることを実証。Firefox では12分で検出、Windows では6時間で完全な攻撃チェーンを完成。月次パッチ戦略が時代遅れに。
Anthropic のセキュリティチームが、大規模言語モデル(LLM)がセキュリティパッチを受け取ったとき、その脆弱性を悪用可能な状態に変換するスピードを測定した衝撃的な研究を公表しました。かつて数週間を要した作業が、現在は数時間で完了します。
パッチ検出の劇的な高速化
Anthropic の Mythos Preview モデルは、セキュリティ研究の定番テストであるブラウザエンジンと OS カーネルに対して、従来の予想を大きく上回るスピードで脆弱性を悪用可能にしました。
Firefox SpiderMonkey エンジンでの実測
Firefox のスクリプトエンジン SpiderMonkey に対するテストでは、18 個の脆弱性パッチを分析:
- 最初の検出:わずか 12 分以内に 14 個の脆弱性を発見
- 証拠提示:最初のエクスプロイト証拠が 40 分以内に確認
- 完全な動作エクスプロイト:8 個を約 12 時間で開発完成
- パッチ公開から実装までの時間:最初のエクスプロイトはパッチ公開からわずか 1 時間後に完成
Windows カーネルでの検出
Microsoft Windows カーネルに対する 21 の脆弱性パッチでは、さらに深刻な結果が示されました:
- 検出コスト:18 個を検出するのに約 $2,200、6 時間以内に完了
- 特権昇格チェーン:8 個の攻撃チェーンを、平均 $2,000 のコストで開発
- 抜き打ちテスト:Microsoft が「悪用の可能性が低い」と評価した 14 個のうち、13 個を突破
パッチ戦略の全面的な再考が急務
従来のセキュリティ運用は、月次のパッチリリースと段階的展開を前提としていました。それには「数週間の専門的作業」が必要という仮定がありました。
しかし、Anthropic の研究はこの仮定を根底から覆しています。Mythos を含む大規模言語モデルが、公開パッチから数時間で実用的な悪用コードを生成できるということは、従来のパッチ展開スケジュールが完全に時代遅れであることを意味します。
特に危険にさらされている分野
すべての環境が等しいリスクを抱えているわけではありません。被害が最も大きくなる可能性が高いのは:
- 産業制御システム(ICS):更新が困難で、数ヶ月の遅延が珍しくない
- 医療機器:動作の安定性が優先されるため、パッチ適用に慎重
- 航空防衛システム:セキュリティと可用性のバランスから慎重な検証が必要
- 重要インフラ:停止時間を最小化する要件から、段階的展開が前提
これらのシステムにおいて、AI による脆弱性悪用が従来想定の数倍のスピードで進行するという事実は、防御側の対応能力を大きく超える脅威となります。
セキュリティ研究者からの指摘:ガードレール戦争
興味深いことに、Anthropic がこの研究成果を安全に社会に提示するために採用した方法そのものが、新たな議論を呼んでいます。
Anthropic の新モデル「Fable」は、セキュリティ研究を目的とした問い合わせに対して非常に厳格なガードレールを設置しました。その結果、サイバーセキュリティの専門家たちから「安全なコード審査の依頼まで拒否される」という批判が出ています。
IBM や他の大手セキュリティ企業の研究者は、「キーワードベースのフィルタリングが過敏に反応し、実質的なセキュリティ研究が困難」と指摘。一方、Anthropic は「Cyber Verification Program」への登録と承認を条件に制限を緩和する方針を示しており、セキュリティとオープンイノベーションのバランスをめぐる課題が浮かび上がっています。
業界全体への示唆
この研究は、単なる技術的なニュースではなく、デジタル社会全体の防御戦略の抜本的な見直しが急務であることを示しています。
マイクロソフト、Apple、Google、Linux Foundation など各社が、現在のパッチ管理体制を抜本的に改革する必要があるでしょう。その中には、自動デプロイメント、ゼロデイ対応能力の強化、そして何より——AI による脅威を前提とした防御設計の構築が含まれます。
Anthropic の研究は、AI がセキュリティの味方であると同時に、セキュリティ脅威の規模と速度を桁違いに拡大させるツールでもあることを改めて明示しました。