Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

2026年5月25日 05:00

💡

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

Anthropic が、約50のパートナー企業と進める産業連携プロジェクト「Project Glasswing」の実績を公開した。Claude Mythos Preview が 1ヶ月間のテストで、システム関連ソフトウェアから 10,000件以上の高・重大度脆弱性を特定した。同時に Anthropic は、脆弱性の検出速度が修正速度をはるかに上回ることで、業界が新たな危機的状況に直面していることを警告している。

実測された検出能力

Project Glasswing での具体的な成果は以下の通りだ。

全体: 約50パートナーによるテストで、月間 10,000件以上の高・重大度脆弱性を特定
Cloudflare: 2,000件のバグを検出（うち 400件が高・重大度）
Mozilla Firefox: 271の未知の脆弱性を発見。前モデルと比較して 10倍以上の検出率
オープンソースプロジェクト: 1,000以上をスキャンし、6,202件の高・重大度脆弱性を発見

これらの数字は、Claude Mythos Preview が既存の脆弱性検出手段を大幅に上回る検出能力を持つことを示している。

「修正が追いつかない」危機

もっとも深刻な問題は、検出と修正のギャップだ。

Anthropic の調査によると、高・重大度のバグ修正には平均 2週間を要する。一方、Mythos Preview による脆弱性検出は月間 10,000件以上。つまり、修正体制の処理能力をはるかに超える速度で脆弱性が蓄積されている。

オープンソース脆弱性の修正率はさらに深刻で、報告された 530件中、実際に修正されたのはわずか 75件（14%）だ。残り 86% の脆弱性は「報告されたが未修正の状態」のまま放置されている。

Anthropic が示す警告

Anthropic は同時に、Claude Mythos Preview のような高能力モデルに対する安全保障上の懸念を表明している。

同社は「no company, itself included, has built safeguards strong enough to prevent misuse of these models（どの企業も、自社を含め、これらのモデルの悪用を防ぐのに十分な保護策を構築していない）」と述べ、脆弱性検出能力の高さと引き換えに、悪用リスクが高まることへの警戒を促している。

インフラ・セキュリティチームの課題

開発者・セキュリティエンジニアにとって、今回の発表は次の2つの意味を持つ。

AI による脆弱性検出の実効性が証明された。従来の自動化ツールよりも大幅に多くのバグを見つけられる。
一方で、修正リソースが新しいボトルネックになった。検出能力の向上に、組織の修正能力が追いついていない。

組織全体のセキュリティ運用が問われる局面だ。検出されたアラートの優先順位付けと、修正プロセスの抜本的な見直しが急務となる。

Project Glasswing が浮き彫りにしたもの

Project Glasswing は、AI による防御的セキュリティの可能性と課題の両面を明らかにした。脆弱性検出という「見つける側」では革新的な進歩がある一方で、「修正する側」の組織体制がそれに追いついていない。次のフェーズでは、検出効率化だけでなく、組織全体のセキュリティ運用設計の再構築が不可欠となる。

記事をシェア

参考ソース

★ 注目 THE DECODER

セキュリティの記事

Meta の常時 AI グラス『Super Sensing』プライバシー懸念、LED 点灯なしで周囲に気付かれず撮影可能

セキュリティ

2026年7月9日

Meta の常時 AI グラス『Super Sensing』プライバシー懸念、LED 点灯なしで周囲に気付かれず撮影可能

Meta がテスト中の AI グラス『Super Sensing』は、カメラ・マイクで常時周囲を記録しながら、LED インジケータが点灯しないため、撮影者に気付かれない設計。収集映像を Meta AI モデル訓練に利用する計画も明らかになり、プライバシー及び GDPR 対応への懸念が急速に高まっています。

ChatGPT・Gemini など9つの主要AIが『HalluSquatting』攻撃で悪用される危険性

セキュリティ

2026年7月9日

ChatGPT・Gemini など9つの主要AIが『HalluSquatting』攻撃で悪用される危険性

セキュリティ研究者が新たな脅威『HalluSquatting』を発見。LLMが『わかりません』と答えられない性質を悪用し、ハッカーが9つの主要AIツール（ChatGPT、Claude、Gemini など）を通じて大規模ボットネットを組み立てられる危険性が判明。企業のセキュリティ態勢に新たな課題。

詐欺対策アプリ Savi がリリース、AIでリアルタイムに通話を検証、月$8から

セキュリティ

2026年7月7日

詐欺対策アプリ Savi がリリース、AIでリアルタイムに通話を検証、月$8から

詐欺防止アプリの Savi が $7M シードラウンドを調達して iOS・Android でローンチした。AI がリアルタイムで通話内容をスクリーニングし、詐欺の行動パターンを検出。月額$8で利用でき、家族でシェア可能。

Claude Mythos のサイバーセキュリティ性能に疑問～小規模オープンモデルで同等の脆弱性検出が可能に

Anthropic が限定公開としていた Claude Mythos のサイバーセキュリティ特化機能ですが、新しい研究により、公開されている小規模オープンモデルでも同等の脆弱性検出能力があることが判明。限定公開戦略の根拠が揺らいでいます。

政策・規制

2026年4月24日

Claude Mythos とインターネットのパワーバランス——企業の安全保障 vs 社会全体のリスク

Anthropic の Claude Mythos は zero-day 脆弱性を自動発見・悪用でき、主要な OS やウェブブラウザ全体の支配すら可能。企業の安全保障戦略と社会全体のリスク管理のバランスが問われている。

NSAが「Mythos」実運用、Anthropicは限定展開を堅持——脆弱性自動検出能力、政府機関に拡大予定

セキュリティ

2026年4月21日

NSAが「Mythos」実運用、Anthropicは限定展開を堅持——脆弱性自動検出能力、政府機関に拡大予定

米情報機関NSAがAnthropicの最強モデル「Mythos Preview」を運用中。数十年埋もれていた脆弱性も検出する強力さゆえ、Anthropicは40組織に限定。Pentagon関係の対立解消の兆しも。

Google、Gemini API Managed Agents に背景実行・MCP サポート――非同期処理で開発効率が飛躍

Google Deepmind は Gemini API の Managed Agents に 4 つの新機能を追加。バックグラウンド実行（非同期）、リモート MCP サーバー接続、カスタム関数の統合、認証情報のリフレッシュを実現。開発者は HTTP 接続を保持せずにエージェントを運用できるように

Google Gemini AI エージェント Model Context Protocol API

Grok 4.5 一般公開、Cursor データで訓練も『自己申告ベンチマーク』に懐疑の声

LLM・生成AI

2026年7月9日

Grok 4.5 一般公開、Cursor データで訓練も『自己申告ベンチマーク』に懐疑の声

SpaceXAI（旧xAI）が Grok 4.5 を一般公開しました。Cursor の実開発セッションを学習に取り込み、Harvey 法律ベンチマークで1位を獲得。価格は入力$2/出力$6（100万トークンあたり）と Opus 4.8 の半分以下ですが、独立系ベンチマークでの検証はまだなく、Cursor ユーザーのコードが無断で学習に使われた可能性も指摘されています。

xAI SpaceXAI Grok Cursor コーディングAI

セキュリティ

2026年7月9日

Meta の常時 AI グラス『Super Sensing』プライバシー懸念、LED 点灯なしで周囲に気付かれず撮影可能

Meta プライバシースマートグラス AI グラスウェアラブル

ロボティクス

2026年7月9日

Mistral がロボティクス参入、単一 RGB カメラで自律 navigation『Robostral Navigate』8B モデル発表

オープンソース LLM で知られる Mistral AI が、ロボティクス市場に本格参入。8 億パラメータの『Robostral Navigate』は単一 RGB カメラのみで複雑環境での自律航行を実現。79.4% の成功率でベンチマーク達成。シミュレーション訓練からの実装、RL による継続的改善を計画。

Mistral ロボティクス navigation AI モデル自律移動

OpenAI、GPT-Live で同時リッスン・スピーク実装、ChatGPT ユーザーが「自然な会話」を今日から体験

LLM・生成AI

2026年7月9日

OpenAI、GPT-Live で同時リッスン・スピーク実装、ChatGPT ユーザーが「自然な会話」を今日から体験

OpenAI が新音声モデル GPT-Live-1 をリリース。フルデュプレックス技術により、ユーザーは話しながら AI に割り込まれ、30～40 分の長時間会話に対応。ChatGPT 無料ユーザーは GPT-Live-1 mini、有料ユーザーは GPT-Live-1 フル版が利用可能。7 月中に API アクセスも予定。

OpenAI ChatGPT 音声AI GPT-Live リアルタイム会話

LLM・生成AI

2026年7月9日

Fable 5 が業界別ベンチマークで全勝するも『100倍のコスト』が課題に

Artificial Analysis の新ベンチマークで、Claude Fable 5 が財務・法律・医療など6つの業界別インデックス全てでトップを獲得。しかし Strategy & Ops インデックスでは Fable 5 は 1タスクあたり $3.48 に対し DeepSeek V4 Pro は $0.03、100倍以上のコスト差が判明。企業の導入判断が価格と性能のバランスで揺れている。

Anthropic Claude ベンチマーク AI コスト LLM 比較

すべての記事を見る

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

実測された検出能力

「修正が追いつかない」危機

Anthropic が示す警告

インフラ・セキュリティチームの課題

Project Glasswing が浮き彫りにしたもの

記事をシェア

タグ

参考ソース

Google 検索で「disregard」が検索不可、AI 要約機能のバグ露呈

Alibaba Qwen3.7-Max、Claude Opus 4.6 と同等の性能を実現——35時間の自律実行で10倍のスピードアップ

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

実測された検出能力

「修正が追いつかない」危機

Anthropic が示す警告

インフラ・セキュリティチームの課題

Project Glasswing が浮き彫りにしたもの

記事をシェア

タグ

参考ソース

Google 検索で「disregard」が検索不可、AI 要約機能のバグ露呈

Alibaba Qwen3.7-Max、Claude Opus 4.6 と同等の性能を実現——35時間の自律実行で10倍のスピードアップ

セキュリティの記事

関連タグの記事

最新記事