Anthropic が最強モデル Claude Mythos をベースとした公開版「Claude Fable 5」をリリースした。同社が「完全な Mythos ではなく、制限されたバージョン」と位置づけるこのモデルは、開発者向けプラットフォーム Claude API を通じて段階的に提供される。

Mythos との差分——セキュリティ制限の実装

Claude Fable 5 は Mythos の強力な機能を備えながらも、高リスク領域での利用を制限する設計となっている。サイバーセキュリティ、生物学、化学、蒸留といった分野での質問に対しては、回答をブロックして OpenAI の Opus 4.8 にフォールバックする。

ただし実運用では、初期データの分析から「少なくとも 95% のセッションが完全に Fable の応答で実行」されることが判明している。つまり、通常のエンジニアリング業務や知識労働の大半は制限の影響を受けない。

テスト・検証済みのセキュリティ

Anthropic は公開前に 1000 時間以上のセキュリティテストを実施。「普遍的な jailbreak は発見されず」という結果を得た。さらに外部のレッドチーム企業による独立した検証も行われ、同様の成果が確認されている。

新たなセキュリティ対策として、30 日間の強制的なデータ保持ポリシーも導入された。Anthropic はこれを「複雑で新規の攻撃への防御」と位置づけており、今後の AI セキュリティの標準となる可能性がある。

提供方法と利用料金

Claude Fable 5 は以下のプラットフォームで利用可能:

  • Claude API — 消費ベース課金
  • エンタープライズプラン — 団体向け
  • サブスクリプション — 個人向け Pro/Max/Team プラン

入出力トークンの料金は Opus 4.8 の約 2 倍で、入力 1000 万トークン当たり 10 ドル、出力は 50 ドルに設定されている。

リリーススケジュール

6 月 22 日までは、Pro/Max/Team およびエンタープライズプランのユーザーが Fable 5 を無料で利用できる。6 月 23 日以降は使用クレジット消費型の課金に移行する。

段階的なロールアウトが予定されており、当面は供給量に制限がある可能性がある。

業界への意味

Anthropic は先週、AI 危険性に関する警告声明で「完全自動化は未来ではない」と述べ、人間と AI の協働モデルを標榜していた。Fable 5 のリリースは、その方針を具体化したものといえる。最強クラスのモデルを「制限付きで公開する」という戦略は、AI 安全性と利用可能性のバランスを、実装レベルで示唆している。

開発者は、Opus 4.8 よりも高速で安価な代替案を得ることになり、Anthropic は市場での競争力を強化する。同時に、セキュリティ制限により法的リスクを軽減する設計となっており、規制環境の厳格化に先手を打つ動きとも解釈できる。