Anthropic、Fable・Mythos のグローバル配布再開——政府一時禁止を解除、99%以上のジャイルブレーク対策を実装
米政府が Anthropic の高度な AI モデル Fable 5・Mythos 5 の輸出規制を撤廃。Amazon の研究チームが発見したジャイルブレークに対する新セキュリティ分類器を実装し、2週間の一時禁止を解除してグローバル配布を再開。
米政府が Anthropic の高度な AI モデル「Fable 5」と「Mythos 5」に対する輸出規制を撤廃した。6月12日に Amazon 研究チームが発見したセキュリティ脆弱性(ジャイルブレーク)を理由に一時禁止されていたが、Anthropic が新セキュリティ分類器を実装することで、2週間で解除に至った。商務長官 Howard Lutnick は同社が「リスク対策で米国政府と緊密に協力した」とコメントしている。
政府一時禁止から解除まで
Anthropic は Fable 5 と Mythos 5 を 6 月初旬にリリース直後、Amazon Web Services(AWS)の AI 研究チームが新しいジャイルブレーク手法を発見。この脆弱性によってセキュリティガードレールを回避できる可能性が判明し、米政府は 6 月 12 日に輸出規制を敷き、全アクセスを一時停止した。
だが Anthropic は素早く対応。政府と協力して、この脆弱性に対処する新セキュリティ分類器を開発・実装したことで、わずか 2 週間で規制解除となった。
新セキュリティ分類器の効果
Anthropic が実装した安全性分類器は、Amazon が報告したジャイルブレーク手法の 99% 以上をブロックできるという。ただし、同社は一定の「誤検知」(harmful でない要求も検知)のトレードオフがあることを認めており、精度と安全性のバランスを取っているとみられる。
THE DECODER の報道によると、Anthropic は「このような脆弱性は Fable・Mythos だけでなく、Haiku 4.5 のような小規模モデルにも同じ手法が適用できる」と指摘。同社は業界標準のセキュリティフレームワーク開発を提案し、Amazon・Microsoft・Google などの大手企業と協力する計画を明らかにした。
グローバル配布再開と業界への影響
Anthropic は「明日からアクセスを復旧開始する」と発表。政府と企業が協力してセキュリティリスクに対処し、商業利益と安全保障のバランスを取った事例として業界から注目されている。
これにより Fable・Mythos は世界中で再び利用可能になり、金融機関・エンタープライズ企業の導入検討が加速する見込み。同時に「AI モデルの安全性検証」が今後の政府認可の重要な基準として定着することも示唆している。