NextAI 海外で話題の最新AIニュース

記事一覧に戻る

セキュリティ

Claude Mythos の優位性に疑問符、オープンモデルも同等の脆弱性発見能力

2026年4月18日 21:20

Anthropic の限定公開モデル Claude Mythos が、サイバーセキュリティ分野で「唯一無二の能力」を持つと宣伝してきたが、独立した2つの研究（AISLE と Vidoc Security）が、小規模なオープンモデルでも同等の脆弱性を発見できることを実証しました。

Mythos の実力：ソフトウェアバグを自動発見

Anthropic は Mythos について、Project Glasswing の 11 の企業・機関コンソーシアムに限定公開。テストによれば、Mythos は「ソフトウェアバグを自動検出し、実行可能なエクスプロイトを構築し、シミュレーション環境で企業ネットワーク全体を支配できる」とされていました。

オープンモデルが次々と同等の性能を実証

研究チームが 8 種類のオープンソースモデルをテストしたところ：

FreeBSD 脆弱性検出: GPT-OSS-20b（35 億パラメータ）を含む全 8 モデルが脆弱性を特定し、エクスプロイト戦略を提案
タスク別の変動性: Claude Opus は論理フローの欠陥に優れていた一方、Deepseek R1 や Kimi K2 は他のタスクで大規模モデルと同等の性能を発揮
偽陽性の課題: 大多数の小規模モデルが、既にパッチされた脆弱性を修正済みと認識できず、実在しない問題を「発見」する傾向

「優位性は個別モデルではなく、システム全体」

研究者たちの結論は重要です：「真の強みは個別モデルにあるのではなく、その周囲に構築されたシステムにある」。つまり、脆弱性の検証、優先順位付け、運用ワークフロー設計などが、Mythos の「ブラックボックス的な優位性」よりも実質的に重要だということです。

Anthropic のアプローチは「一種のモデル独占論」に基づいていたが、実際には「検査・検証システムの堅牢性」が勝敗を分けるという指摘は、AI セキュリティ産業全体に波紋を広げそうです。

記事をシェア

タグ

Claude Mythos cybersecurity vulnerability open models AI research

参考ソース

★ 注目 THE DECODER

セキュリティの記事

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

セキュリティ

2026年5月27日

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

Starlette に発見された脆弱性「BadHost」は、週間ダウンロード数325百万のパッケージを使用するAIエージェント・ロボティクスアプリに広く影響。開発者はただちに更新対応が必要。

AI 時代の脆弱性競争——攻撃者と防御側の AI 利用が急速化

セキュリティ

2026年5月26日

AI 時代の脆弱性競争——攻撃者と防御側の AI 利用が急速化

WIRED の分析によると、AI による脆弱性検出と悪用が急速に進んでいる。攻撃者が AI を使った exploit 開発を加速させる中、防御側も AI を駆使した脆弱性対策に乗り出している。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

セキュリティ

2026年5月25日

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

関連タグの記事

セキュリティ

2026年4月18日

「秘密兵器Mythos」は本当に特別なのか——小規模オープンモデルがAnthropicの独占性に疑問を呈する

Anthropic が限定公開する Claude Mythos は、サイバーセキュリティの「最強モデル」とされてきた。しかし、独立した研究が示すのは、小規模なオープンソースモデルでも同等の脆弱性検出能力を持つという現実だ。

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

2026年5月27日

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

Anthropic の Claude Mythos が 1946 年から未解決だったエルデシュの単位距離予想を解く。「かわいい、シンプルな証明」と評価され、AI 駆動型の数学発見に「深刻な余力」が存在することが明らかになった。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

セキュリティ

2026年5月25日

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

最新記事

AI が人間の投資家を上回る、ベンチャー予測トーナメントで4/5の精度を実現

2026年5月27日

AI が人間の投資家を上回る、ベンチャー予測トーナメントで4/5の精度を実現

University of Michigan の研究で、Gemini 2.5 Pro が MBA 卒業生と投資家 3 名よりも正確にテック企業の成功を予測。戦略的先見性は人間固有の能力ではなくなった。

AI 予測ベンチャー投資 LLM

テクノロジー

2026年5月27日

Claude Code と OpenClaw が起こした『テック業界の大混乱』——計算機時代で最大級の変革に

Claude CodeとOpenClawは、コンピューティング業界に前例のない規模の変革をもたらしました。WIREDが『定義的な物語』として分析する、AIエージェント革命がなぜテック業界を揺るがし続けているのか。

Claude Code OpenClaw AI エージェントソフトウェア開発業界変革

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

セキュリティ

2026年5月27日

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

Starlette に発見された脆弱性「BadHost」は、週間ダウンロード数325百万のパッケージを使用するAIエージェント・ロボティクスアプリに広く影響。開発者はただちに更新対応が必要。

セキュリティ脆弱性 Python Starlette AI エージェント

OpenRouter が Series B で 1.3B ドル評価へ、1年で 2 倍以上——マルチモデルプラットフォームの急成長

2026年5月27日

OpenRouter が Series B で 1.3B ドル評価へ、1年で 2 倍以上——マルチモデルプラットフォームの急成長

AI API ゲートウェイの OpenRouter が CapitalG 主導の Series B で $113 million を調達、約 $1.3 billion のポスト評価に到達。6 ヶ月で 5 倍の利用成長を記録し、ベンダーロックイン回避需要の高まりを示す。

OpenRouter シリーズ B 資金調達マルチモデル AI ビジネス

Hugging Face が $2,500 の 3D プリント可能なバイペダルロボットを公開——ロボティクス研究の民主化へ

ロボティクス

2026年5月27日

Hugging Face が $2,500 の 3D プリント可能なバイペダルロボットを公開——ロボティクス研究の民主化へ

Hugging Face がオープンソースの 3D プリント可能なロボット脚プロジェクトを発表。$2,500 で構築可能な二足歩行ロボットにより、開発者・研究者がロボティクス実験を手軽に開始できる環境を整備する。

Hugging Face ロボティクスオープンハードウェア 3D プリント開発者

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

2026年5月27日

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

Anthropic の Claude Mythos が 1946 年から未解決だったエルデシュの単位距離予想を解く。「かわいい、シンプルな証明」と評価され、AI 駆動型の数学発見に「深刻な余力」が存在することが明らかになった。

Claude Mythos 数学エルデシュ予想 AI 能力 Anthropic

すべての記事を見る