Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

2026年5月19日 22:11

💡

Cloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。

CloudflareがAnthropicのセキュリティ重視型AIモデル「Mythos Preview」を自社インフラで実機テストした結果をまとめたブログ「Project Glasswing」を公開しました。注目すべきは、Mythos Previewが従来のフロンティアモデルが見落とした複雑な脆弱性チェーンを検出できたという点です。

テスト概要

CloudflareはMythos Previewを50以上の自社コードリポジトリに対してテストを実施しました。一部の汎用LLMは個別の脆弱性は検出できても、複数の小さなバグを結合して実際に機能する攻撃チェーンを構築できていません。一方、Mythos Previewはそうしたチェーンを正確に特定できました。

Mythos Previewの優位性

1. エクスプロイトチェーン構築

Mythos は個別の脆弱性をつなぎ合わせて、実際に動作する攻撃シナリオを証明できます。コードの自動コンパイル・実行・仮説調整といったサイクルを自力で回すことが可能です。

2. ノイズ削減と精度向上

Cloudflare CSO Grant Bourzikas は「早期のモデルは同様の個別バグを検出しましたが、複数要素の結合に失敗しました」と述べています。Mythos Previewは以下の点で優れています：

推測的な指摘が少ない（誤検出率が低い）
明確な再現手順を提供（セキュリティチームの検証負担が少ない）
修正または却下の判断に必要な作業が最小化

3. 多段階検証フレームワーク

Cloudflareは単一エージェントではなく、最大50並列エージェント + 対立的レビュー機能を備えた多段階ハーネスを構築してテストを実施。第二エージェントが各発見の反論を試みることで、検出結果の信頼性を高めています。

警告と制限事項

Cloudflareは重要な警告を明示しています：「これらの機能は攻撃者にも利用可能になる」。つまり、Mythos Previewが脆弱性チェーンを検出できるということは、同じ能力が悪意ある用途にも転用可能ということです。

開発者向けへの含意

Mythos Previewの高い検出精度は、セキュリティ重視の企業にとって脅威モデリングの価値を高めます。ただし同時に、AIが発見できる複雑な脆弱性チェーンに対する防御策の急速な進化が不可欠になったことを示唆しています。

開発チームは単なるペネトレーションテストではなく、AI駆動のセキュリティ検証を組織のプロセスに組み込む必要が出てきました。

記事をシェア

参考ソース

セキュリティの記事

セキュリティ

2026年5月20日

Ocean、AI フィッシング対策のエージェント型メールセキュリティで $28M 調達——元 Iron Dome 研究員の起業

イスラエルのサイバーセキュリティ専門家 Shay Shwartz が創設した Ocean が、Lightspeed Venture Partners からの主導で $28M のシリーズ調達に成功。LLM ベースのカスタム言語モデルで AI 駆動型フィッシング攻撃に対抗する企業向けメールセキュリティプラットフォーム。

OpenAI が Google の SynthID 採用・C2PA 標準推進、AI 画像検証を業界標準化へ

セキュリティ

2026年5月20日

OpenAI が Google の SynthID 採用・C2PA 標準推進、AI 画像検証を業界標準化へ

OpenAI が Google 開発の SynthID ウォーターマーク技術を製品に統合し、C2PA メタデータ標準にも対応。Nvidia・Google との連携で、AI 生成画像の信頼性検証が業界スタンダード化。フェイク対策の重要度が一気に高まる。

セキュリティ

2026年5月19日

主要 LLM が架空の事実を信じ込む――実験で 5 つのモデルの「説得可能性」が判明

映画や小説に存在しないシーンについて、 ChatGPT・Claude・Gemini 等の言語モデルが虚偽を真実として受け入れる。研究者が開発した「nudge trial」手法で脆弱性を実証。

NSAが「Mythos」実運用、Anthropicは限定展開を堅持——脆弱性自動検出能力、政府機関に拡大予定

米情報機関NSAがAnthropicの最強モデル「Mythos Preview」を運用中。数十年埋もれていた脆弱性も検出する強力さゆえ、Anthropicは40組織に限定。Pentagon関係の対立解消の兆しも。

セキュリティ

2026年4月18日

Claude Mythos の『セキュリティ特化性』の神話が崩壊——小規模オープンモデルも同等の脆弱性発見が可能

Anthropic が独占的な能力を謳う Claude Mythos サイバーセキュリティモデルについて、2 つの独立した研究が、小規模なオープンソースモデルでも同等かそれ以上の脆弱性検出が可能であることを示した。競争優位性は個別モデルではなく『システム全体構築』にあると両研究は結論づける。

Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

セキュリティ

2026年5月14日

Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

Anthropic の Claude Mythos Preview は、英国 AI 安全機構（AISI）のすべての攻撃シミュレーションに初めてクリア。32 段階企業ネットワーク侵攻を 6 割成功させ、産業制御システムも突破。AISI はサイバー能力の倍増スピードを再度短縮し、AI 脅威が想定を上回るペースで進化していることを警告。

Google AI Studio、Kotlin・Jetpack Compose でネイティブ Android アプリ自動生成

Google AI Studio が Native Android アプリ自動生成機能を追加。Kotlin と Jetpack Compose を使用して本格的なネイティブアプリを一からコード記述することなく生成でき、ブラウザベースのエミュレーターで即座にテストが可能。従来の Google Play Store の位置付けを変える可能性のある機能として注目されている。

Google AI Studio Android Kotlin Jetpack Compose

Deepseek、Claude Code 対抗のコーディングエージェント「Deepseek Code」開発を発表

LLM・生成AI

2026年5月21日

Deepseek、Claude Code 対抗のコーディングエージェント「Deepseek Code」開発を発表

中国の AI スタートアップ Deepseek が Beijing に新しいチーム「Harness」を設立し、Claude Code・OpenAI Codex・Cursor に対抗するコーディングエージェント「Deepseek Code」の開発を発表した。Agent Loops・MCP・コンテキストエンジニアリングなど高度なスキルを持つ人材を募集している。

Deepseek Deepseek Code コーディングエージェント Claude Code OpenAI Codex

Nature に掲載：Google の AI 科学助手が仮説生成から薬剤候補発見まで自動化、計算モデリングを民主化

テクノロジー

2026年5月21日

Nature に掲載：Google の AI 科学助手が仮説生成から薬剤候補発見まで自動化、計算モデリングを民主化

Google DeepMind と Harvard が開発した ERA（Empirical Research Assistance）は、科学ソフトウェア設計・仮説生成・実験設計・データ分析を自動化し Nature で実証。神経科学から感染症予測、医薬品スクリーニングまで専門家レベルの研究成果を数時間～数日で実現。

Google DeepMind 科学 AI Nature 医薬品開発自動研究