Anthropic 共同創設者が警告——2028年末までに60%の確率で、AIが自動的に後継者を訓練する

2026年5月6日 14:42

💡

Jack Clark が公開データから分析。AI R&D の完全自動化が起こるリスクを数値化。SWE-Bench の成功率が2%から93.9%へ、CPU最適化タスクで2.9倍から52倍へと急速に進化。複利エラーの問題と、監督者を上回る知能獲得時のアライメント崩壊の危険を指摘

Anthropic 共同創設者で Import AI ニュースレター編集者の Jack Clark が、長編エッセイで警告を発している。AI システムが自動的に自身より強力な後継者を訓練できるようになる確率は、2028年末までに約60%、2027年末までに約30% だという。人間の監督なしに AI R&Dが完全に自動化される時代が、数年以内に到来する可能性を示唆している。

急速な能力進化の証拠

Clark が根拠とした公開データの数字は、驚異的だ。

SWE-Bench （GitHub の実務的な問題解決能力）：Claude 2 が 2023年後半に成功率 2% → 最新モデルで 93.9%
CPU最適化タスク （小規模言語モデルの訓練実装を高速化）：Opus 4（2025年5月）の 2.9倍から Mythos（2026年4月）で 52倍へ
METR タイムホライズン （与えられたタスクを完了するまでの時間）：GPT-3.5 の約30秒から最新モデルで約12時間に延伸

これらのベンチマークは、モデルが「自身の訓練のボトルネック」を診断・最適化できる能力が、指数関数的に向上していることを示す。AI が AI 研究そのものに従事する準備が整いつつあるという証拠だ。

アライメント崩壊の複利エラー問題

ただし Clark は、この能力向上の一方で、深刻な安全保障上の不安を喚起している。

再帰的自動改善では、エラーが複利で蓄積する。どれだけ精密な AI アライメント技術でも、99.9% の精度では最初の段階で「ほぼ完璧」に見えても：

50世代後：精度が約95% へ低下
500世代後：精度が約60% へ低下

人間の監督者が AI システムを「完全に制御下に置く」ことが前提となっているアライメント手法は、「AI が監督者を大きく上回る知能」を獲得した時点で機能しなくなる可能性がある。つまり、人間による監視・検査のサイクルを AI 自身が短縮・自動化するにつれ、安全性チェックが形骸化するリスクがある。

Anthropic Institute の設立背景

この警告は、Clark が最近 Anthropic Institute の責任者に就任したことと符号している。Anthropic Institute は「より強力な AI を管理する社会的課題に取り組む」ために設立された。再帰的自動改善の時代を前に、ガバナンス・規制・国際協力の枠組みを整備する必要性が、技術側からも鮮明に指摘されている。

Clark の分析が正確であれば、AI 産業と政府は数年以内に、前例のない規制課題に直面することになる。自動 AI 研究の展開を「予測・制御・適切に監視できるか」が、今後の AI 安全保障を左右する。

記事をシェア

参考ソース

LLM・生成AIの記事

xAI、Custom Voices で独自音声クローン機能をリリース——1分の録音で AI 音声生成

LLM・生成AI

2026年5月2日

xAI、Custom Voices で独自音声クローン機能をリリース——1分の録音で AI 音声生成

xAI が新機能「Custom Voices」を公開。ユーザーが約1分間の音声を録音するだけで、AI が個人専用のボイスクローンを作成。テキスト音声変換やボイスエージェント API と統合可能で、開発者エコシステムを強化。

LLM・生成AI

2026年5月2日

xAI が Grok 4.3 をリリース——大幅値下げと Imagine エージェント機能

xAI は2026年5月2日、Grok 4.3 をリリースしました。入力トークン 40%、出力トークン 60% の価格引き下げにより、OpenAI・Anthropic との競争を加速。新たな Imagine エージェントは創作プロジェクトの反復作業に対応します。

LLM・生成AI

2026年5月1日

AI の感情配慮がエラーを招く——精度より満足度を優先する訓練の落とし穴

ユーザーの感情を配慮するよう訓練された AI モデルほど、正確性が低下するという研究が判明。過度なチューニングが『ユーザー満足度』と『真実性』の間に矛盾を生む。

AGI は完全制御できない——多様な AI エコシステムが安全性の鍵に

キングス・カレッジ・ロンドンの研究チームが、十分に強力なAIは完全な統制が数学的に不可能と証明。代わりに多様性による相互抑制がAGI安全性を実現する新しい視点。

White House、新しいAIモデルの公開前に政府審査を義務付ける大統領令を検討――Anthropic Mythos が導火線に

政策・規制

更新 2026年5月6日

White House、新しいAIモデルの公開前に政府審査を義務付ける大統領令を検討――Anthropic Mythos が導火線に

Trump 政権は脱規制路線から転換し、frontier AI モデルの公開前に安全性レビューを実施する仕組みを検討。Anthropic Mythos のソフトウェア脆弱性特定能力が、政権内の脅威認識を急速に高めた

Anthropic CEO DariaがMythosモデル保留の戦略を語る——セキュリティ懸念 vs 批判的見方

LLM・生成AI

2026年4月12日

Anthropic CEO DariaがMythosモデル保留の戦略を語る——セキュリティ懸念 vs 批判的見方

Anthropic は新型AI「Mythos」を発表しながらも公開を見送り、セキュリティリスクの管理責任を強調。一方で投資家誘致のためのPR戦術という指摘も。

Google と Meta、個人向けAIエージェント開発で猛追——Project Remy/Hatch で Anthropic・OpenAI に対抗

GoogleはProject Remy、MetaはProject Hatchと名付けた個人向けAIエージェントを秘密裏に開発中です。両社とも従来のブラウザエージェントから、メール・カレンダー・ショッピングなどの統合型アシスタントへシフト。Anthropic・OpenAIに大きく遅れていた両社の巻き返しが始まりました。

AI agents Google Meta Anthropic OpenAI

DeepSeek、数週間で時価総額を$20B→$45Bに倍増——中国の国家ファンド主導で資金調達

ビジネス

2026年5月7日

DeepSeek、数週間で時価総額を$20B→$45Bに倍増——中国の国家ファンド主導で資金調達

中国のAI企業DeepSeekが約$45億ドルの資金調達ラウンドを進めています。主導投資家は中国政府の集積回路産業投資基金（Big Fund）とTencent。創業者Liang Wenfengは全体の89.5%を保有したままで、わずか数週間で時価総額が倍増した背景には、中国の AI 戦略と地政学的な競争が存在します。

DeepSeek 資金調達中国AI 大規模言語モデル