Claude Mythos の『セキュリティ特化性』の神話が崩壊——小規模オープンモデルも同等の脆弱性発見が可能

2026年4月18日 21:21

💡

Anthropic が独占的な能力を謳う Claude Mythos サイバーセキュリティモデルについて、2 つの独立した研究が、小規模なオープンソースモデルでも同等かそれ以上の脆弱性検出が可能であることを示した。競争優位性は個別モデルではなく『システム全体構築』にあると両研究は結論づける。

Anthropic が政府や企業向けに「比類なき」セキュリティ能力を標榜する Claude Mythos について、複数の外部研究が、小規模なオープンソースモデルでも同等の成果を上げられることを実証した。

AISLE の検証：すべてのモデルが脆弱性検出

セキュリティ企業 AISLE の創業者 Stanislav Fort は、Anthropic が公開したサンプルコードを複数のモデルでテスト。8 つのモデル全てが FreeBSD のメモリバグを検出し、わずか 36 億パラメータの GPT-OSS-20b を含めすべてが、発見した脆弱性の重大度を正しく評価したことを報告した。

Vidoc Security による再現

Vidoc Security は GPT-5.4 と Claude Opus 4.6 を OpenCode と組み合わせて、Mythos の発見を独立検証。小規模モデルも Anthropic と同じバグを検出できることを確認した。

能力のばらつきと限界

ただし能力は一貫していない。Qwen3 32B は FreeBSD では高い性能を示しても、OpenBSD では脆弱性を見落とすなど、モデルごとに得意・不得意が異なる。また、パッチ適用後のコード安全性を認識できるモデルは限定的だった。

競争優位は「システム全体」

両研究の結論は一致する：個別のモデルでなく「システム全体の設計が実質的な競争優位性を持つ」と。つまり Anthropic の強みは Mythos というモデル自体ではなく、それを運用・検証・配備する仕組みにある可能性が高い。

記事をシェア

参考ソース

★ 注目 THE DECODER

セキュリティの記事

MIT が新しい AI 安全テスト技術を開発——違法コンテンツ生成能力を『実行なし』で検出

セキュリティ

2026年7月14日

MIT が新しい AI 安全テスト技術を開発——違法コンテンツ生成能力を『実行なし』で検出

MIT の研究チームが『ガウシアンプローービング』という新監査技術を開発。児童虐待素材（CSAM）生成に適応したモデルを、実際に生成を試みることなく 100% の精度で判別。AI 安全性の新たな防御層として、開発者・企業に即座に活用できる見通し。

AI エージェント狙いの Prompt Injection に新しい防御技法『Context Bombing』——攻撃者の仕込みより先に自分たちが「騒ぎ立てる」戦略

セキュリティ

2026年7月14日

AI エージェント狙いの Prompt Injection に新しい防御技法『Context Bombing』——攻撃者の仕込みより先に自分たちが「騒ぎ立てる」戦略

セキュリティ研究者がエージェント攻撃に対する防御手法『Context Bombing』を提案。従来の『プロンプトを厳しくチェック』という受け身の防御ではなく、エージェント自体が意図的に大量の無関係なコンテキストを生成して動作を阻害する。LLM アプリケーション開発者にとって実装可能な新戦術。

Cambridge研究が実証：テロ組織がClaude、ChatGPTなど主要AIを攻撃計画・爆発装置開発に悪用——安全フィルター失敗が明らかに

セキュリティ

2026年7月12日

Cambridge研究が実証：テロ組織がClaude、ChatGPTなど主要AIを攻撃計画・爆発装置開発に悪用——安全フィルター失敗が明らかに

Cambridge AI Science & Policy Programme の研究により、ボコ・ハラムを含むテロ組織が ChatGPT、Claude、Gemini などの主要AIを攻撃計画や兵器開発に悪用していることが判明。ISIS による組織的なプロンプト工学訓練も実施。AI企業の安全機構が実戦での悪用を完全には防止できない危機を浮き彫りにしました。

Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

Cloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。

NSAが「Mythos」実運用、Anthropicは限定展開を堅持——脆弱性自動検出能力、政府機関に拡大予定

セキュリティ

2026年4月21日

NSAが「Mythos」実運用、Anthropicは限定展開を堅持——脆弱性自動検出能力、政府機関に拡大予定

米情報機関NSAがAnthropicの最強モデル「Mythos Preview」を運用中。数十年埋もれていた脆弱性も検出する強力さゆえ、Anthropicは40組織に限定。Pentagon関係の対立解消の兆しも。

Qihoo 360が Anthropic 製 Mythos に対抗、脆弱性発見・サイバー防御 AI を発表

テクノロジー

2026年6月28日

Qihoo 360が Anthropic 製 Mythos に対抗、脆弱性発見・サイバー防御 AI を発表

中国のサイバーセキュリティ企業・Qihoo 360 が Tu Long Feng（自動脆弱性発見）と Yi Tian Zhen（自動サイバー防御）という2つの AI ツールを発表。創業者・周宏毅は「サイバー核兵器」と位置付けるMythos への対抗姿勢を示す。中国モデルは西側比で20～30%劣後しつつ、エージェントベース戦略で追い上げへ。

OpenAI Codex、エージェント間の指令を暗号化——開発者は内部処理を追跡不可に

OpenAI が 6 月初旬から Codex でエージェント間通信を暗号化。開発者はメインエージェントがサブエージェントにどう委譲するかを「もう見えない」。GPT-5.6 Sol/Terra では強制。復号化エラーも報告。

OpenAI Codex AI エージェント暗号化開発者体験

政策・規制

2026年7月15日

Meta、AIが育休・障害者を「削減対象」と判定——人員整理で差別訴訟

Meta の人員削減で、AIシステムが育児休暇取得者や障害者を不当にタグ付けして解雇対象に選定したとして、従業員ら数十人が訴訟を提起。アルゴリズム差別の実例が法廷へ。

Meta AI 差別アルゴリズム人事評価

OpenAI 研究者 Miles Wang が AI ドラッグディスカバリー企業を創業、$2B 評価で資金調達中

ビジネス

2026年7月15日

OpenAI 研究者 Miles Wang が AI ドラッグディスカバリー企業を創業、$2B 評価で資金調達中

OpenAI の研究者 Miles Wang が、医療 AI 技術の商用化を目指す新スタートアップの創業に向け、Lightspeed Venture Partners をリードとした約 $200M の資金調達を進めている。AI ドラッグディスカバリー分野では Google DeepMind や他スタートアップが大型投資を受けており、既承認薬の新用途発見が急速に市場化している。

AI医療ドラッグディスカバリー OpenAI バイオテック資金調達

PixVerse が Series C で $439M 調達、$2B 評価に——AI 動画生成市場で複数企業が $10 億超え争い

ビジネス

2026年7月15日

PixVerse が Series C で $439M 調達、$2B 評価に——AI 動画生成市場で複数企業が $10 億超え争い

シンガポール拠点の AI 動画生成企業 PixVerse が Series C ラウンドで $439M を調達し、企業評価は $2B に達した。ByteDance 出身の経営陣が率い、Alibaba・Mirae Asset から出資を受ける。動画生成市場ではスタートアップが次々と大型評価を獲得し、業界全体の高速成長を示唆している。

AI動画生成資金調達 PixVerse ByteDance Alibaba

Reflection AI が Nebius と $10億ドルのコンピュート契約——オープンソース AI の独立インフラ戦略

テクノロジー

2026年7月15日

Reflection AI が Nebius と $10億ドルのコンピュート契約——オープンソース AI の独立インフラ戦略

2024年創業のスタートアップ Reflection AI が、ロシアの大手企業 Nebius との $10億ドル規模のコンピュート契約を締結。Nvidia 最新チップへのアクセスを確保し、オープンウェイト AI モデル開発を加速。SpaceX に続く企業による独立リソース確保の動きが加速しています。

Reflection AI オープンソースAI コンピュート契約 Nvidia AI インフラ