Claude Mythos のサイバーセキュリティ性能に疑問～小規模オープンモデルで同等の脆弱性検出が可能に

2026年4月18日 21:21

💡

Anthropic が限定公開としていた Claude Mythos のサイバーセキュリティ特化機能ですが、新しい研究により、公開されている小規模オープンモデルでも同等の脆弱性検出能力があることが判明。限定公開戦略の根拠が揺らいでいます。

Anthropic は Claude Mythos というサイバーセキュリティ特化モデルを開発し、11の組織からなるコンソーシアムに限定的にアクセスを提供していました。同社は、Mythos が「ソフトウェアバグの発見、独立した動作可能なエクスプロイトの構築、企業ネットワーク全体の支配」を可能とする特別な能力を持つと主張していました。

しかし、新しい研究により、この限定公開戦略の根拠が大きく揺らいでいます。

小規模オープンモデルで再現可能な能力

複数の独立した研究機関による調査では、公開されている小規模で部分的にオープンなモデルでも、Mythos と同等のサイバーセキュリティ分析能力があることが明らかになりました。

AISLE という研究機関は、OpenSSL で 15 件、curl で 5 件の脆弱性を報告し、8つのモデルすべてが FreeBSD バグを検出できることを確認。Vidoc Security も GPT-5.4 と Claude Opus 4.6 を使用し、同等の結果を示すことに成功しています。

「多くの目」の方が脆弱性を見つける

研究者たちは、「一人の優れた探偵が推測で探すより、千人の適切な探偵がどこでも探した方がバグを見つけられる」という視点を提示しています。つまり、Anthropic の限定公開モデルより、複数の小規模オープンモデルの協働の方が、より多くの脆弱性を検出できる可能性があるということです。

この研究は、Anthropic の「Mythos は他の公開モデルを圧倒する能力を持つ」という主張に直接的な疑問を呈しており、サイバーセキュリティ分野における限定公開AI戦略の妥当性を問い直す重要な指摘となっています。

記事をシェア

参考ソース

★ 注目 THE DECODER

セキュリティの記事

MIT が新しい AI 安全テスト技術を開発——違法コンテンツ生成能力を『実行なし』で検出

セキュリティ

2026年7月14日

MIT が新しい AI 安全テスト技術を開発——違法コンテンツ生成能力を『実行なし』で検出

MIT の研究チームが『ガウシアンプローービング』という新監査技術を開発。児童虐待素材（CSAM）生成に適応したモデルを、実際に生成を試みることなく 100% の精度で判別。AI 安全性の新たな防御層として、開発者・企業に即座に活用できる見通し。

AI エージェント狙いの Prompt Injection に新しい防御技法『Context Bombing』——攻撃者の仕込みより先に自分たちが「騒ぎ立てる」戦略

セキュリティ

2026年7月14日

AI エージェント狙いの Prompt Injection に新しい防御技法『Context Bombing』——攻撃者の仕込みより先に自分たちが「騒ぎ立てる」戦略

セキュリティ研究者がエージェント攻撃に対する防御手法『Context Bombing』を提案。従来の『プロンプトを厳しくチェック』という受け身の防御ではなく、エージェント自体が意図的に大量の無関係なコンテキストを生成して動作を阻害する。LLM アプリケーション開発者にとって実装可能な新戦術。

Cambridge研究が実証：テロ組織がClaude、ChatGPTなど主要AIを攻撃計画・爆発装置開発に悪用——安全フィルター失敗が明らかに

セキュリティ

2026年7月12日

Cambridge研究が実証：テロ組織がClaude、ChatGPTなど主要AIを攻撃計画・爆発装置開発に悪用——安全フィルター失敗が明らかに

Cambridge AI Science & Policy Programme の研究により、ボコ・ハラムを含むテロ組織が ChatGPT、Claude、Gemini などの主要AIを攻撃計画や兵器開発に悪用していることが判明。ISIS による組織的なプロンプト工学訓練も実施。AI企業の安全機構が実戦での悪用を完全には防止できない危機を浮き彫りにしました。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

LLM・生成AI

2026年4月18日

Claude Mythos の『独占能力』神話が崩壊：小規模オープンモデルも同じサイバーセキュリティバグを発見

Anthropic が『危険すぎて公開できない』として限定提供する Claude Mythos。しかし独立研究者の検証で、小規模なオープンソースモデルでも同等の脆弱性検出が可能であることが判明。特別性への疑問が高まっています。

Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

セキュリティ

2026年5月19日

Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

Cloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。

OpenAI Codex、エージェント間の指令を暗号化——開発者は内部処理を追跡不可に

OpenAI が 6 月初旬から Codex でエージェント間通信を暗号化。開発者はメインエージェントがサブエージェントにどう委譲するかを「もう見えない」。GPT-5.6 Sol/Terra では強制。復号化エラーも報告。

OpenAI Codex AI エージェント暗号化開発者体験

政策・規制

2026年7月15日

Meta、AIが育休・障害者を「削減対象」と判定——人員整理で差別訴訟

Meta の人員削減で、AIシステムが育児休暇取得者や障害者を不当にタグ付けして解雇対象に選定したとして、従業員ら数十人が訴訟を提起。アルゴリズム差別の実例が法廷へ。

Meta AI 差別アルゴリズム人事評価

OpenAI 研究者 Miles Wang が AI ドラッグディスカバリー企業を創業、$2B 評価で資金調達中

ビジネス

2026年7月15日

OpenAI 研究者 Miles Wang が AI ドラッグディスカバリー企業を創業、$2B 評価で資金調達中

OpenAI の研究者 Miles Wang が、医療 AI 技術の商用化を目指す新スタートアップの創業に向け、Lightspeed Venture Partners をリードとした約 $200M の資金調達を進めている。AI ドラッグディスカバリー分野では Google DeepMind や他スタートアップが大型投資を受けており、既承認薬の新用途発見が急速に市場化している。

AI医療ドラッグディスカバリー OpenAI バイオテック資金調達

PixVerse が Series C で $439M 調達、$2B 評価に——AI 動画生成市場で複数企業が $10 億超え争い

ビジネス

2026年7月15日

PixVerse が Series C で $439M 調達、$2B 評価に——AI 動画生成市場で複数企業が $10 億超え争い

シンガポール拠点の AI 動画生成企業 PixVerse が Series C ラウンドで $439M を調達し、企業評価は $2B に達した。ByteDance 出身の経営陣が率い、Alibaba・Mirae Asset から出資を受ける。動画生成市場ではスタートアップが次々と大型評価を獲得し、業界全体の高速成長を示唆している。

AI動画生成資金調達 PixVerse ByteDance Alibaba

Reflection AI が Nebius と $10億ドルのコンピュート契約——オープンソース AI の独立インフラ戦略

テクノロジー

2026年7月15日

Reflection AI が Nebius と $10億ドルのコンピュート契約——オープンソース AI の独立インフラ戦略

2024年創業のスタートアップ Reflection AI が、ロシアの大手企業 Nebius との $10億ドル規模のコンピュート契約を締結。Nvidia 最新チップへのアクセスを確保し、オープンウェイト AI モデル開発を加速。SpaceX に続く企業による独立リソース確保の動きが加速しています。

Reflection AI オープンソースAI コンピュート契約 Nvidia AI インフラ