Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」
Cloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。
続きを読むCloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。
続きを読むPalisade Research が実証した AI エージェントのハッキングおよび自己複製能力が急速に向上。Opus 4.6 では成功率が 81% に達した。サイバーセキュリティの将来が AI に支配される可能性。
続きを読む米情報機関NSAがAnthropicの最強モデル「Mythos Preview」を運用中。数十年埋もれていた脆弱性も検出する強力さゆえ、Anthropicは40組織に限定。Pentagon関係の対立解消の兆しも。
続きを読むAnthropic が独占的な能力を謳う Claude Mythos サイバーセキュリティモデルについて、2 つの独立した研究が、小規模なオープンソースモデルでも同等かそれ以上の脆弱性検出が可能であることを示した。競争優位性は個別モデルではなく『システム全体構築』にあると両研究は結論づける。
続きを読むAnthropic が限定公開としていた Claude Mythos のサイバーセキュリティ特化機能ですが、新しい研究により、公開されている小規模オープンモデルでも同等の脆弱性検出能力があることが判明。限定公開戦略の根拠が揺らいでいます。
続きを読むOpenAIのCodex Securityは、AIでコードベースを横断して脆弱性を自動検出する新しいエージェントです。初期報告ではOpenSSHやChromiumでギャップが示され、導入には検証や運用ルールの整備が重要だと分かります。
続きを読むCodex Securityはプロジェクト文脈を理解して脆弱性の検出・検証・修正案提示を自動化する研究プレビューで、検出精度向上とノイズ低減に期待が高まっています。
続きを読むOpenAIとParadigmが公開したEVMbenchは、AIエージェントによるEthereumスマートコントラクトの脆弱性検出・修正・悪用デモを一括で評価し、実運用とガバナンス整備を促す重要な指標です。
続きを読むClaude Opus 4.5やGPT-5らが模擬環境でスマートコントラクトの脆弱性を検証し、透明性と説明責任を軸にしたガバナンス強化や現場教育の実務化が重要だと示されました
続きを読む社内ハッカソンで生まれた複数のAIエージェントが協働し、脆弱性の発見から自動修正案までを提案する取り組みが進んでおり、開発現場の効率化と早期対応に期待が高まる一方で、導入には段階的な検証とガバナンス整備が重要です
続きを読む