Claude Mythos の『セキュリティ特化性』の神話が崩壊——小規模オープンモデルも同等の脆弱性発見が可能
Anthropic が独占的な能力を謳う Claude Mythos サイバーセキュリティモデルについて、2 つの独立した研究が、小規模なオープンソースモデルでも同等かそれ以上の脆弱性検出が可能であることを示した。競争優位性は個別モデルではなく『システム全体構築』にあると両研究は結論づける。
Anthropic が政府や企業向けに「比類なき」セキュリティ能力を標榜する Claude Mythos について、複数の外部研究が、小規模なオープンソースモデルでも同等の成果を上げられることを実証した。
AISLE の検証:すべてのモデルが脆弱性検出
セキュリティ企業 AISLE の創業者 Stanislav Fort は、Anthropic が公開したサンプルコードを複数のモデルでテスト。8 つのモデル全てが FreeBSD のメモリバグを検出し、わずか 36 億パラメータの GPT-OSS-20b を含めすべてが、発見した脆弱性の重大度を正しく評価したことを報告した。
Vidoc Security による再現
Vidoc Security は GPT-5.4 と Claude Opus 4.6 を OpenCode と組み合わせて、Mythos の発見を独立検証。小規模モデルも Anthropic と同じバグを検出できることを確認した。
能力のばらつきと限界
ただし能力は一貫していない。Qwen3 32B は FreeBSD では高い性能を示しても、OpenBSD では脆弱性を見落とすなど、モデルごとに得意・不得意が異なる。また、パッチ適用後のコード安全性を認識できるモデルは限定的だった。
競争優位は「システム全体」
両研究の結論は一致する:個別のモデルでなく「システム全体の設計が実質的な競争優位性を持つ」と。つまり Anthropic の強みは Mythos というモデル自体ではなく、それを運用・検証・配備する仕組みにある可能性が高い。