Anthropic、Fable・Mythos のグローバル配布再開——政府一時禁止を解除、99%以上のジャイルブレーク対策を実装

2026年7月2日 09:00

💡

米政府が Anthropic の高度な AI モデル Fable 5・Mythos 5 の輸出規制を撤廃。Amazon の研究チームが発見したジャイルブレークに対する新セキュリティ分類器を実装し、2週間の一時禁止を解除してグローバル配布を再開。

米政府が Anthropic の高度な AI モデル「Fable 5」と「Mythos 5」に対する輸出規制を撤廃した。6月12日に Amazon 研究チームが発見したセキュリティ脆弱性（ジャイルブレーク）を理由に一時禁止されていたが、Anthropic が新セキュリティ分類器を実装することで、2週間で解除に至った。商務長官 Howard Lutnick は同社が「リスク対策で米国政府と緊密に協力した」とコメントしている。

政府一時禁止から解除まで

Anthropic は Fable 5 と Mythos 5 を 6 月初旬にリリース直後、Amazon Web Services（AWS）の AI 研究チームが新しいジャイルブレーク手法を発見。この脆弱性によってセキュリティガードレールを回避できる可能性が判明し、米政府は 6 月 12 日に輸出規制を敷き、全アクセスを一時停止した。

だが Anthropic は素早く対応。政府と協力して、この脆弱性に対処する新セキュリティ分類器を開発・実装したことで、わずか 2 週間で規制解除となった。

新セキュリティ分類器の効果

Anthropic が実装した安全性分類器は、Amazon が報告したジャイルブレーク手法の 99% 以上をブロックできるという。ただし、同社は一定の「誤検知」（harmful でない要求も検知）のトレードオフがあることを認めており、精度と安全性のバランスを取っているとみられる。

THE DECODER の報道によると、Anthropic は「このような脆弱性は Fable・Mythos だけでなく、Haiku 4.5 のような小規模モデルにも同じ手法が適用できる」と指摘。同社は業界標準のセキュリティフレームワーク開発を提案し、Amazon・Microsoft・Google などの大手企業と協力する計画を明らかにした。

グローバル配布再開と業界への影響

Anthropic は「明日からアクセスを復旧開始する」と発表。政府と企業が協力してセキュリティリスクに対処し、商業利益と安全保障のバランスを取った事例として業界から注目されている。

これにより Fable・Mythos は世界中で再び利用可能になり、金融機関・エンタープライズ企業の導入検討が加速する見込み。同時に「AI モデルの安全性検証」が今後の政府認可の重要な基準として定着することも示唆している。

記事をシェア

参考ソース

ビジネスの記事

ビジネス

更新 2026年7月2日

Meta、AI クラウドビジネスで AWS・GCP・Azure に対抗——余剰コンピュート容量を商用化へ

Meta が AI コンピュート容量を販売する新規クラウドビジネス「Meta Compute」を本格始動。$182.9 billion の投資規模で複数年展開、SpaceX/xAI のモデルに倣い、Anthropic や Google などの AI 企業が顧客になる想定。AWS/GCP/Azure との競争が激化。

AI の失敗が教える教訓——Ford が350人のベテラン技術者を再雇用、品質改善に成功

ビジネス

2026年7月1日

AI の失敗が教える教訓——Ford が350人のベテラン技術者を再雇用、品質改善に成功

Ford が AI 主導の設計・製造システムの品質不足で数十億ドルの損失を経験。その後、業界経験豊かな技術者『グレイビアード・エンジニア』350人を再雇用し、品質改善で『数百万ドルの成果』を実現。AI 導入の落とし穴と人材の価値を示唆

Amazon が $1B AI エージェント展開部門を設立、OpenAI・Anthropic と異なる戦略で企業への浸透狙う

ビジネス

2026年7月1日

Amazon が $1B AI エージェント展開部門を設立、OpenAI・Anthropic と異なる戦略で企業への浸透狙う

AWS が Forward-Deployed Engineer（FDE）組織に 10 億ドルを投じ、顧客企業へ AI エージェントを常駐デプロイ。OpenAI・Anthropic が提携モデルを採用する中、Amazon は内部組織として独自の道を切り開く。

Anthropic セキュリティ研究が示す新たな脅威——AIは数時間でセキュリティパッチを悪用可能

Anthropic の研究が、大規模言語モデルが脆弱性パッチから悪用可能な状態を数時間で構築できることを実証。Firefox では12分で検出、Windows では6時間で完全な攻撃チェーンを完成。月次パッチ戦略が時代遅れに。

NSA、Anthropic の最強 AI モデル Mythos を採用——米政府内で高度なサイバー能力をめぐる綱引き

政策・規制

更新 2026年6月6日

NSA、Anthropic の最強 AI モデル Mythos を採用——米政府内で高度なサイバー能力をめぐる綱引き

米国家安全保障局（NSA）が Anthropic の最先端 AI モデル Mythos Preview を運用していることが明らかに。Pentagon との対立の中での採用。

Anthropic Claude Mythos が脆弱性発見で米当局を緊急招集——FRB議長ら銀行首脳が個別会談、AI セキュリティリスクが政策テーブルに

政策・規制

2026年4月11日

Anthropic Claude Mythos が脆弱性発見で米当局を緊急招集——FRB議長ら銀行首脳が個別会談、AI セキュリティリスクが政策テーブルに

Anthropic の最新 AI モデル Claude Mythos が数千件の未知の脆弱性を自動発見。緊迫した国家セキュリティ懸念により、米連邦準備制度理事会議長 Jerome Powell ら政府高官が主要銀行の経営陣と緊急協議。

Gemini Spark が Mac に進出——Google Tasks・Dropbox 統合で「考える AI」がデスクトップを支配

Google が高度なエージェント型 AI「Gemini Spark」を Mac に展開開始しました。外部アプリ統合とリアルタイムトラッキング機能で、従来の AI チャットボットを大きく上回る生産性支援が可能に。

Google Gemini AI アシスタント macOS エージェント

Meta の脳→テキスト AI 精度向上——39% の誤字率達成、非侵襲で麻痺患者の「声」を取り戻す可能性

テクノロジー

2026年7月2日

Meta の脳→テキスト AI 精度向上——39% の誤字率達成、非侵襲で麻痺患者の「声」を取り戻す可能性

Meta 研究チームが Brain2Qwerty v2 を発表。脳磁図センサーから直接テキストに変換する技術が大幅に改善され、侵襲型脳インプラントに近い精度に接近しつつあります。医療応用への道が一歩前に進みました。

Meta 脳科学 AI 医療応用神経インターフェース

Tripadvisor の AI サマリー、重大な苦情を隠蔽——食中毒やセクハラを「清潔」「親切」と要約

政策・規制

2026年7月2日

Tripadvisor の AI サマリー、重大な苦情を隠蔽——食中毒やセクハラを「清潔」「親切」と要約

ホテル評判サイト Tripadvisor が提供している AI 要約機能が、食中毒やセクハラといった重大な苦情を軽視している実態が明かされました。機械学習による自動要約の危険性が改めて浮き彫りになっています。

Tripadvisor AI 要約機能消費者被害アルゴリズム

AI ブラウザが「夢の中」でガードレール無効化——基本的な誤情報だけで危険コード生成を促進

セキュリティ

2026年7月2日

AI ブラウザが「夢の中」でガードレール無効化——基本的な誤情報だけで危険コード生成を促進

AI IDE（Cursor・Continue等）が致命的な脆弱性に直面。ユーザーが LLM に『2+2=5』などの基本的な誤情報を与えるだけで、ガードレールを完全にバイパスされ、危険なコード生成・セキュリティ脆弱性の悪用法を素直に応答してしまう。

AI セキュリティガードレール回避 LLM 脆弱性 AI IDE Cursor

Cloudflare、AI企業に「コンテンツ対価」を強制——9月15日から Training・Agent クローラーをデフォルトブロック

政策・規制

2026年7月2日

Cloudflare、AI企業に「コンテンツ対価」を強制——9月15日から Training・Agent クローラーをデフォルトブロック

Cloudflare は AI 企業が出版社コンテンツを無断利用することに対抗し、9 月 15 日から広告表示ページで Training・Agent クローラーをデフォルトブロック。ステーブルコイン決済を活用した Monetization Gateway で、クリエイターが AI 学習データの使用料を受け取れる仕組みが始まる。

Cloudflare AI 学習データ著作権パブリッシャー保護 x402 プロトコル