Claude Mythos のサイバーセキュリティ能力は再現可能：小オープンモデルも同等の脆弱性検出に成功

2026年4月18日 21:20 更新: 2026年5月2日 08:10

💡

Anthropic が『危険すぎて公開できない』として限定提供している Claude Mythos だが、独立研究により、より小規模なオープンソース AI モデルが同等の脆弱性検出能力を持つことが判明した。

Anthropic が特別に開発・限定提供している Claude Mythos は、サイバーセキュリティの脅威を自動検出し、動作するエクスプロイトを構築できるとされていた。同社は「この能力は極めて危険であり、信頼できる企業にのみ提供する」と公言していた。

だが、独立した 2 つの研究が、この「独占的能力」の神話を突き崩した。

Anthropic の主張

Anthropic は Claude Mythos について、以下の能力を持つとしていた：

システムの脆弱性を自動的に発見
実際に動作するエクスプロイト（悪用コード）を構築
企業ネットワーク全体を乗っ取ることまで可能

これらの能力は「極めて危険」として、モデルの一般公開は見送られ、米国政府・金融機関などの限定的なパートナーのみに提供されている。

小オープンモデルが同等の結果を達成

2 つの独立研究機関（AISLES と Vidoc Security）が、実際にはより小規模で公開されているオープンソース AI モデルが同等の脆弱性検出能力を持つことを証明した。

具体例として挙げられたのが FreeBSD NFS 脆弱性（CVE-2026-4747）。わずか 36 億個のアクティブパラメータを持つ GPT-OSS-20b を含む 8 種類のモデルが、すべてメモリバグの検出に成功した。

さらに注目すべき点は、Kimi K2 というモデルが、Anthropic も言及していなかった追加の詳細（他マシンへの自動感染可能性）を指摘したことだ。これは、小規模モデルが単に「Mythos と同じレベル」ではなく、場合によっては「それ以上の洞察」を提供することを示唆している。

本当の優位性は何か

研究者たちの結論は、Anthropic の「独占性」の主張に対する明確な反論となっている。

彼らは「脆弱性検出の優位性は、単一のモデルの能力にはなく、検証メカニズム、優先順位付けロジック、ワークフロー全体といったシステムレベルの設計にある」と指摘した。

つまり、より大きなモデルが本質的に優れているのではなく、適切なシステム設計があれば、小規模なオープンモデルでも十分に実用的なセキュリティツールになり得るということだ。

業界への示唆

この研究は、AI によるセキュリティ脅威の防御戦略に対する重要な問いを投げかけている。Anthropic が「危険すぎて公開できない」と判断した能力が、実は多くのモデルが備えているのであれば、セキュリティ対策は「モデルの隔離」よりも「適切な利用制限」と「透明性」に基づく必要があるのではないか、という議論を促している。

アップデート（2026年5月2日）

英国の AI Security Institute の検証で、OpenAI の GPT-5.5 も Mythos と同等のサイバーセキュリティ性能を有することが新たに判明しました。

GPT-5.5 は既に ChatGPT および API を通じて一般利用可能な状態で提供されており、「Mythos だけが持つ特異な能力」という Anthropic の主張がさらに揺らいでいます。この結果は、4月18日の小オープンモデル同等説に続く第二の検証であり、「Mythos のサイバー脅威は特定のモデルに限定された breakthrough ではない」 という結論を強化しています。

セキュリティコミュニティでは、今後さらに多くのモデルが同等能力を示すことが予想され、Anthropic が掲げてきた「限定提供の根拠」自体の再検討が不可避となる見通しです。

記事をシェア

参考ソース

セキュリティの記事

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

セキュリティ

2026年5月27日

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

Starlette に発見された脆弱性「BadHost」は、週間ダウンロード数325百万のパッケージを使用するAIエージェント・ロボティクスアプリに広く影響。開発者はただちに更新対応が必要。

セキュリティ

2026年5月26日

AI 時代の脆弱性競争——攻撃者と防御側の AI 利用が急速化

WIRED の分析によると、AI による脆弱性検出と悪用が急速に進んでいる。攻撃者が AI を使った exploit 開発を加速させる中、防御側も AI を駆使した脆弱性対策に乗り出している。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

セキュリティ

2026年5月25日

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

Cloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。

Anthropic、防御者向け「Claude Security」を発表——攻撃者と同等のAI優位性を提供

セキュリティ

2026年5月1日

Anthropic、防御者向け「Claude Security」を発表——攻撃者と同等のAI優位性を提供

Anthropicは新しいセキュリティツール「Claude Security」を発表。高度な脆弱性スキャン機能で、サイバー防御者に攻撃者と同等のAI優位性をもたらす。

セキュリティ

更新 2026年5月8日

Anthropic の Mythos、Mozilla Firefox で 271 件のセキュリティ脆弱性を発見

Anthropic の最新サイバーセキュリティAI『Mythos』が、Mozilla Firefox 150 で 271 件のセキュリティ脆弱性を特定。Mozilla CTO は『世界最高のセキュリティ研究者と同等の能力』と評価する一方、OpenAI の Sam Altman は『恐怖に基づくマーケティング』と批判。