AnthropicがClaude Mythos Preview限定公開、数千の脆弱性を発見——セキュリティ特化AI

2026年4月8日 19:12

💡

AnthropicのClaude Mythosは、OSとブラウザに存在する数千の脆弱性を発見。「リリースするには危険」という判断で限定プレビューに。セキュリティAIの可能性と課題が浮き彫りに。

Anthropic はセキュリティ特化のAIモデル「Claude Mythos Preview」を限定公開した。一般向けのリリースではなく、選定された顧客グループのみがアクセス可能という慎重な戦略である。

数千の脆弱性を発見、公開困難な状況

Claude Mythos の最大の特徴は、検出能力である。同モデルは、主要なすべてのオペレーティングシステムとWebブラウザに存在する数千の高度な脆弱性を発見している。

その具体例は業界の現実を示している。OpenBSD の27年前のバグ、FFmpeg の16年前の脆弱性、FreeBSD の17年前のNFSサーバー脆弱性など、長年未検出だった古い脆弱性をClaude Mythos が掘り起こした。多くは修正方法が存在しない状態である。

「リリースするには危険」という判断

このため、Anthropic は一般向けのモデル公開を見送った。OpenAI が 2019年に GPT-2 について「リリースするには危険」と判断した歴史があるが、Claude Mythos はその判断を今、実際の証拠を伴って繰り返している。

当時 GPT-2 は、危険性の証拠が不十分だとして業界から疑問視されたが、Claude Mythos の場合は異なる。データセンター、政府機関、金融システム……未修正の脆弱性が多数存在する重要インフラに対する実在するリスクが数字として示されている。

限定プレビューでセキュリティ専門家との協業

Anthropic は限定アクセスのプレビュー形式により、セキュリティ専門家との協業を進めている。これにより、発見された脆弱性の報告と修正の調整を計画的に進める狙いと考えられる。

サイバーセキュリティAIの開発が、AIリスク管理の新しい課題を生み出す状況が明確になった。

記事をシェア

参考ソース

セキュリティの記事

Telegram で AI を悪用した非合意画像ネットワーク——280 万件メッセージから露出した違法エコシステム

セキュリティ

2026年4月8日

Telegram で AI を悪用した非合意画像ネットワーク——280 万件メッセージから露出した違法エコシステム

AI Forensics の調査が、Telegram でボット化した非合意画像生成ツールを使った違法ネットワークを報告。イタリア・スペインで 24,000 人以上が参加、月額アフィリエイト収入は数千ユーロに。

Anthropic、Project Glasswing で Apple・Google と提携——AI サイバー防御で45以上の組織が結集

セキュリティ

2026年4月8日

Anthropic、Project Glasswing で Apple・Google と提携——AI サイバー防御で45以上の組織が結集

Anthropic が Claude Mythos Preview を活用した大規模な産業連携プロジェクト「Project Glasswing」を発表。AI の脆弱性発見と防御能力の向上を目指す。

OpenAI・Anthropic・Google が中国の無断モデルコピーに対抗、Frontier Model Forum で連携

セキュリティ

2026年4月7日

OpenAI・Anthropic・Google が中国の無断モデルコピーに対抗、Frontier Model Forum で連携

3大 AI 企業が Bloomberg への報道を受けて中国企業による AI モデルの無断蒸留（distillation）に対抗する連携を表明。Deepseek、Moonshot、Minimax の抽出手法が対象。

Anthropic、サイバーセキュリティ特化の新モデル Claude Mythos をプレビューリリース

Anthropic が新世代モデル Claude Mythos をセキュリティ専門企業向けにプレビューリリース。Project Glasswing イニシアティブで Apple、Microsoft、Cisco など 12 社と協力。数千のゼロデイ脆弱性を発見済み。

Anthropic、Claude Mythos Preview 正式発表——防御的サイバーセキュリティに特化した AI モデル

LLM・生成AI

2026年4月8日

Anthropic、Claude Mythos Preview 正式発表——防御的サイバーセキュリティに特化した AI モデル

Anthropic が新モデル「Claude Mythos Preview」を正式発表。企業と政府機関の限定グループと協力して、AI を活用した防御的セキュリティワークに取り組む。

Anthropic が Microsoft の Azure インフラ責任者を採用、インフラ強化へ

ビジネス

2026年4月8日

Anthropic が Microsoft の Azure インフラ責任者を採用、インフラ強化へ

Anthropic がマイクロソフトの Azure AI プラットフォーム責任者 Eric Boyd を新たなインフラストラクチャ責任者として採用。Claude の急増する需要に対応するため。

Telegram で AI を悪用した非合意画像ネットワーク——280 万件メッセージから露出した違法エコシステム

AI 悪用 Telegram 非合意画像ディープフェイクオンラインハラスメント

AI チャットボットが引用する情報源の 4 分の 1 がジャーナリズム由来——Muckrack の 1500 万件分析

ビジネス

2026年4月8日

AI チャットボットが引用する情報源の 4 分の 1 がジャーナリズム由来——Muckrack の 1500 万件分析

AI チャットボット（ChatGPT、Claude、Gemini）の回答における引用の 25% がジャーナリズムに由来することが Muckrack の調査で判明。メディア産業への経済的インパクトが浮き彫りに。

AI チャットボットジャーナリズム Muckrack メディア

Google、学術研究支援の AI エージェント 2 つを発表——論文作成と査読を自動化

LLM・生成AI

2026年4月8日

Google、学術研究支援の AI エージェント 2 つを発表——論文作成と査読を自動化

Google は論文の図表自動生成と査読を行う 2 つの AI エージェントを発表。研究者の負担軽減と査読の効率化を実現する。

Google AI エージェント学術研究自動化

ビジネス

2026年4月8日

Stability AIがBrand Studio発表、ブランド一貫性を保つAI画像生成を自動化

Stability AIが商用プラットフォームBrand Studioをローンチ。ブランド固有モデルの訓練から自動化された制作ワークフローまで、クリエイティブチームのAI活用を統合。

Stability AI AI デザイン生成AI

MetaがMuse Spark発表、初のフロンティアモデルで戦略転換——オープンウェイト放棄へ

LLM・生成AI

2026年4月8日

MetaがMuse Spark発表、初のフロンティアモデルで戦略転換——オープンウェイト放棄へ

MetaがMuse Sparkを発表。初のフロンティアAIモデルで、オープンソース戦略から方針転換。業界トップ級の性能を実現し、Llama比で10倍以上の効率を誇る。

Meta AI フロンティアモデル

Anthropic、サイバーセキュリティ特化の新モデル Claude Mythos をプレビューリリース

LLM・生成AI

2026年4月8日

Anthropic、サイバーセキュリティ特化の新モデル Claude Mythos をプレビューリリース

Claude Anthropic セキュリティ AI

すべての記事を見る

AnthropicがClaude Mythos Preview限定公開、数千の脆弱性を発見——セキュリティ特化AI

数千の脆弱性を発見、公開困難な状況

「リリースするには危険」という判断

限定プレビューでセキュリティ専門家との協業

記事をシェア

タグ

参考ソース

MetaがMuse Spark発表、初のフロンティアモデルで戦略転換——オープンウェイト放棄へ

Stability AIがBrand Studio発表、ブランド一貫性を保つAI画像生成を自動化

セキュリティの記事

関連タグの記事

最新記事