Anthropic が政府や企業向けに「比類なき」セキュリティ能力を標榜する Claude Mythos について、複数の外部研究が、小規模なオープンソースモデルでも同等の成果を上げられることを実証した。

AISLE の検証:すべてのモデルが脆弱性検出

セキュリティ企業 AISLE の創業者 Stanislav Fort は、Anthropic が公開したサンプルコードを複数のモデルでテスト。8 つのモデル全てが FreeBSD のメモリバグを検出し、わずか 36 億パラメータの GPT-OSS-20b を含めすべてが、発見した脆弱性の重大度を正しく評価したことを報告した。

Vidoc Security による再現

Vidoc Security は GPT-5.4 と Claude Opus 4.6 を OpenCode と組み合わせて、Mythos の発見を独立検証。小規模モデルも Anthropic と同じバグを検出できることを確認した。

能力のばらつきと限界

ただし能力は一貫していない。Qwen3 32B は FreeBSD では高い性能を示しても、OpenBSD では脆弱性を見落とすなど、モデルごとに得意・不得意が異なる。また、パッチ適用後のコード安全性を認識できるモデルは限定的だった。

競争優位は「システム全体」

両研究の結論は一致する:個別のモデルでなく「システム全体の設計が実質的な競争優位性を持つ」と。つまり Anthropic の強みは Mythos というモデル自体ではなく、それを運用・検証・配備する仕組みにある可能性が高い。