NextAI 海外で話題の最新AIニュース

記事一覧に戻る

Claude Mythos の『独占能力』神話が崩壊：小規模オープンモデルも同じサイバーセキュリティバグを発見

2026年4月18日 21:22

💡

Anthropic が『危険すぎて公開できない』として限定提供する Claude Mythos。しかし独立研究者の検証で、小規模なオープンソースモデルでも同等の脆弱性検出が可能であることが判明。特別性への疑問が高まっています。

Anthropic は新型 AI モデル Claude Mythos を「極度に危険な能力を持つため、11 の選ばれた組織にのみ提供」と説明してきました。しかし、独立研究者による検証で、GPT-OSS-20b など比較にならないほど小規模なオープンソースモデルが、同じサイバーセキュリティの脆弱性を発見できることが明らかになりました。

Claude Mythos の謳い文句

Anthropic はプロジェクト Glasswing を通じて、Claude Mythos が以下の能力を持つと主張：

脆弱性を自律的に発見
エクスプロイトを構築
ネットワークへの侵害を実行

これらの能力の危険性を理由に、アクセスを厳しく制限してきました。

検証結果の衝撃

独立研究チーム AISLE が検証した結果：

FreeBSD バグテストで、わずか 3.6B のアクティブパラメータを持つ GPT-OSS-20b（パラメータ総数は 20B）が脆弱性を検出
テストした 8 つのモデルすべてがメモリ脆弱性を発見
Kimi K2 は、Anthropic が強調していなかった自己伝播の詳細さえ発見

何が起こっているのか

研究者の指摘：「1 人の優秀な探偵よりも、千人の平凡な探偵が広く探しまわる方が、より多くのバグを見つける」。

Anthropic の戦略には 2 つの解釈があります：

真の能力差説：Claude Mythos は本当に特別な能力を持っている
リソース確保説：能力よりも、十分な計算リソースが確保できるまで市場に出さない戦略

結果として、Anthropic の「独占的な危険性」という主張の説得力は大きく低下。AI セキュリティの議論は、単一の「強力なモデル」への依存ではなく、多様なアプローチの併用へシフトする可能性があります。

記事をシェア

タグ

Claude Mythos Anthropic オープンモデルサイバーセキュリティ

参考ソース

★ 注目 THE DECODER

LLM・生成AIの記事

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

2026年5月27日

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

Anthropic の Claude Mythos が 1946 年から未解決だったエルデシュの単位距離予想を解く。「かわいい、シンプルな証明」と評価され、AI 駆動型の数学発見に「深刻な余力」が存在することが明らかになった。

2026年5月26日

Y Combinator の Paul Graham が AI 生成メールへの違和感を表明——信頼喪失の心理と研究

Y Combinator 創設者の Paul Graham は、AI で書かれたメールに対して『嘘をつかれているような気がする』と表明。複数の研究が、受け取る側の信頼喪失を実証しています。

Google DeepMind の AlphaProof Nexus、56年間未解のエルデシュ問題を含む9件を自動解法――数学証明の新たなAI利用法を実証

2026年5月25日

Google DeepMind の AlphaProof Nexus、56年間未解のエルデシュ問題を含む9件を自動解法――数学証明の新たなAI利用法を実証

形式化検証言語 Lean を用いた記号的フィードバックループにより、OpenAI の自然言語アプローチとは異なる数学証明戦略を確立。数百ドルの推論コストで業界のベンチマークを拡張。

関連タグの記事

Claude Mythos のサイバーセキュリティ性能に疑問～小規模オープンモデルで同等の脆弱性検出が可能に

セキュリティ

2026年4月18日

Claude Mythos のサイバーセキュリティ性能に疑問～小規模オープンモデルで同等の脆弱性検出が可能に

Anthropic が限定公開としていた Claude Mythos のサイバーセキュリティ特化機能ですが、新しい研究により、公開されている小規模オープンモデルでも同等の脆弱性検出能力があることが判明。限定公開戦略の根拠が揺らいでいます。

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

セキュリティ

2026年5月25日

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

政策・規制

2026年4月24日

Claude Mythos とインターネットのパワーバランス——企業の安全保障 vs 社会全体のリスク

Anthropic の Claude Mythos は zero-day 脆弱性を自動発見・悪用でき、主要な OS やウェブブラウザ全体の支配すら可能。企業の安全保障戦略と社会全体のリスク管理のバランスが問われている。

最新記事

AI が人間の投資家を上回る、ベンチャー予測トーナメントで4/5の精度を実現

2026年5月27日

AI が人間の投資家を上回る、ベンチャー予測トーナメントで4/5の精度を実現

University of Michigan の研究で、Gemini 2.5 Pro が MBA 卒業生と投資家 3 名よりも正確にテック企業の成功を予測。戦略的先見性は人間固有の能力ではなくなった。

AI 予測ベンチャー投資 LLM

テクノロジー

2026年5月27日

Claude Code と OpenClaw が起こした『テック業界の大混乱』——計算機時代で最大級の変革に

Claude CodeとOpenClawは、コンピューティング業界に前例のない規模の変革をもたらしました。WIREDが『定義的な物語』として分析する、AIエージェント革命がなぜテック業界を揺るがし続けているのか。

Claude Code OpenClaw AI エージェントソフトウェア開発業界変革

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

セキュリティ

2026年5月27日

Python Webフレームワーク Starlette の重大脆弱性「BadHost」、AI エージェント数百万が危険

Starlette に発見された脆弱性「BadHost」は、週間ダウンロード数325百万のパッケージを使用するAIエージェント・ロボティクスアプリに広く影響。開発者はただちに更新対応が必要。

セキュリティ脆弱性 Python Starlette AI エージェント

OpenRouter が Series B で 1.3B ドル評価へ、1年で 2 倍以上——マルチモデルプラットフォームの急成長

2026年5月27日

OpenRouter が Series B で 1.3B ドル評価へ、1年で 2 倍以上——マルチモデルプラットフォームの急成長

AI API ゲートウェイの OpenRouter が CapitalG 主導の Series B で $113 million を調達、約 $1.3 billion のポスト評価に到達。6 ヶ月で 5 倍の利用成長を記録し、ベンダーロックイン回避需要の高まりを示す。

OpenRouter シリーズ B 資金調達マルチモデル AI ビジネス

Hugging Face が $2,500 の 3D プリント可能なバイペダルロボットを公開——ロボティクス研究の民主化へ

ロボティクス

2026年5月27日

Hugging Face が $2,500 の 3D プリント可能なバイペダルロボットを公開——ロボティクス研究の民主化へ

Hugging Face がオープンソースの 3D プリント可能なロボット脚プロジェクトを発表。$2,500 で構築可能な二足歩行ロボットにより、開発者・研究者がロボティクス実験を手軽に開始できる環境を整備する。

Hugging Face ロボティクスオープンハードウェア 3D プリント開発者

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

2026年5月27日

Claude Mythos がエルデシュ予想を「シンプルな証明」で解く——AI 数学能力の新マイルストーン

Anthropic の Claude Mythos が 1946 年から未解決だったエルデシュの単位距離予想を解く。「かわいい、シンプルな証明」と評価され、AI 駆動型の数学発見に「深刻な余力」が存在することが明らかになった。

Claude Mythos 数学エルデシュ予想 AI 能力 Anthropic

すべての記事を見る