Claude Code、自動探索で AI スケーリング新アルゴリズムを発見——計算量70%削減を実現
UMD・Google・Meta の研究チームが、Claude Code を使用してテスト時のスケーリング新アルゴリズムを自動発見。信頼度追跡に基づくアルゴリズムが従来の自己一貫性と比べ約70%の計算削減を実現。開発費は40ドル、処理時間は160分。
Claude Code が自動発見した新しいスケーリングアルゴリズム
UMD、UVA、WUSTL、UNC、Google、Meta の研究チームが、Claude Code を使ってアルゴリズム自動探索システム「AutoTTS」を開発し、従来の方法では考え付かないような AI スケーリングアルゴリズムを発見しました。
発見されたアルゴリズムの仕組み
新しいアルゴリズムは「信頼度追跡型」(confidence tracking)という仕組みで動作します。
基本的なロジック
- モデルの信頼度を監視 — 回答が確実に見えるかどうかを検証
- 信頼度がほぼ同じ場合 — より多くの並列推論経路を開く
- 信頼度が急速に上昇した場合 — 新しい経路の開拓をスキップ
- 最後に多数決 — 複数の経路から最良の答えを選定
多数派と一致する経路には追加の計算を割き、複数ラウンドで誤った方向に進むと判定された経路のみ削除される仕組みです。
テスト時スケーリング——従来手法との比較
従来の自己一貫性(Self-Consistency)とは
従来の標準的な手法は、同じプロンプトに対して複数回(64個)の並列回答を生成し、多数決で正解を選ぶというものでした。
AutoTTS の成果
新しいアルゴリズムは、この自己一貫性と比べて:
| 指標 | 削減量 |
|---|---|
| トークン使用量 | 約 70% 削減 |
| 精度 | 維持(同等) |
| 開発コスト | 40 ドル |
| 実行時間 | 160 分 |
自己一貫性と比べて約 70% のトークン削減を達成しながら、同等の精度を保ち続けています。
AutoTTS(自動テスト時スケーリング)の探索方法
AutoTTS は、アルゴリズムの「幅」(並列経路数)と「深さ」(各経路の長さ)という 2 次元の制御空間でアルゴリズムを自動探索します。
- Claude Code が複数ラウンドで改良案を提案
- 各案をテスト環境で実行して性能評価
- フィードバックに基づいて次の候補を生成
という反復プロセスを通じて、人間の研究者では思いつかないような効率的なアルゴリズムが発見されました。
実用性と今後の展開
新しいアルゴリズムは、オフライン環境で事前に生成された推論経路を使用するため、実装が可能な設計になっています。ただし現在は幅と深さの 2 次元のみに対応しており、より複雑なスケーリング構造への対応はまだ先の課題です。
研究の意義
このプロジェクトが示すことは:
- Claude Code の能力 — アルゴリズム設計の自動化が実現段階にある
- 計算効率の改善 — テスト時スケーリング領域での大幅なコスト削減が可能
- AI による AI 研究 — LLM 自身がより優れた LLM の設計に貢献できる
特に、開発費 40 ドルで 160 分の処理時間という低コストで発見されたという事実は、AI 研究のコスト・効率性が大きく改善されていることを示しています。
まとめ
Claude Code を使った自動アルゴリズム探索は、AI 開発コストの削減と性能の向上を両立させる新しいパラダイムを示唆しています。今後、このようなアプローチがより多くの AI 研究領域で活用される可能性があります。