Claude Mythos の「独占的セキュリティ能力」が神話に——小規模オープンモデルも同等の脆弱性分析が可能、Anthropic の非公開アクセス制限に疑問

2026年4月18日 21:20

💡

Anthropic が Project Glasswind でアクセスを11団体に限定していた Claude Mythos のセキュリティ分析能力。しかし新しい研究により、GPT-OSS-20b（わずか36億パラメータ）などの小規模オープンモデルでも、同レベルの脆弱性検出・エクスプロイト構築が可能であることが判明。Anthropic の「非公開アクセス」戦略の根拠が揺らいでいる。

Anthropic の最新セキュリティモデル Claude Mythos に対する「独占的能力」という前提が揺らいでいます。新しい研究によって、小規模かつ公開されているオープンソース AI モデルでも、Anthropic が誇ってきた脆弱性分析能力を再現できることが判明しました。

Anthropic の限定アクセス戦略の背景

Anthropic は Claude Mythos について、以下の能力を主張していました：

ソフトウェアバグの自動発見
独立した動作可能なエクスプロイトの構築
企業ネットワーク全体の乗っ取り

これらの能力の「危険性」を理由に、Anthropic は Project Glasswind という限定プログラムを通じて、わずか11団体のみに Claude Mythos へのアクセスを制限してきました。

小規模モデルで再現される能力

しかし2つの独立した研究グループ（AIASLE と Vidoc Security）の検証により、この限定戦略の根拠が厳しく問われています。

テストの概要と結果

FreeBSD NFS 脆弱性（CVE-2026-4747）：

テスト対象の8つのモデルすべてが、メモリバグを検出
わずか36億パラメータの GPT-OSS-20b でさえ「重大度高」と判定

完全なエクスプロイトチェーンの構築：

GPT-OSS-120b が完全な公開エクスプロイトチェーンを独立して再構築
Qwen3 32B・Deepseek R1 も高い性能を発揮

ばらつきも存在

OpenBSD の脆弱性テストでは、モデル間での性能にばらつきが出現。これは脆弱性分析の難易度が常に均一ではないことを示唆しています。

Anthropic の非公開戦略への疑問

今回の研究結果は、いくつかの重要な質問を投げかけています：

セキュリティリスク本当に Claude Mythos 独占か？ 小規模モデルでも同等の能力があれば、限定アクセス制限の正当性は低下する
競争阻止的では？ Project Glasswind による限定は、安全保障より市場支配の側面がないか
業界標準化の障害 政府・企業の脆弱性分析インフラが Anthropic に依存する構造の継続

学術コミュニティの台頭

今回の検証は、大手 AI 企業の主張を独立した研究で検証する重要性を示しています。オープンソースモデルの進化が加速する中、「非公開モデルでしかできない」という言説は、研究透明性と競争環境に影響を与えるリスク要因として注視される必要があります。

Anthropic が Claude Mythos のアクセス範囲の拡大を検討するのか、あるいは限定戦略の正当性を改めて主張するのかは、今後のセキュリティ AI 市場の姿勢を占う重要なポイントになるでしょう。

記事をシェア

参考ソース

★ 注目 THE DECODER

セキュリティの記事

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

セキュリティ

2026年5月27日

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

Starlette に発見された脆弱性「BadHost」は、週間ダウンロード数325百万のパッケージを使用するAIエージェント・ロボティクスアプリに広く影響。開発者はただちに更新対応が必要。

セキュリティ

2026年5月26日

AI 時代の脆弱性競争——攻撃者と防御側の AI 利用が急速化

WIRED の分析によると、AI による脆弱性検出と悪用が急速に進んでいる。攻撃者が AI を使った exploit 開発を加速させる中、防御側も AI を駆使した脆弱性対策に乗り出している。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

セキュリティ

2026年5月25日

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

Anthropic Mythos が『ハッキングを激化させる』と懸念——脆弱性発見が修正速度を圧倒、Project Glasswing で企業を秘密裏にサポート

Anthropic の Mythos が数千のゼロデイ脆弱性を自動発見・悪用できる能力を持つため、公開は見送られ、Project Glasswing を通じて Amazon・Apple・Cisco・JPMorgan・Nvidia など主要企業のみに提供。AI が脆弱性を発見する速度が企業の修正速度を圧倒し、大規模サイバー攻撃の懸念が高まっている。