Claude Code が自動発見した新しいスケーリングアルゴリズム

UMD、UVA、WUSTL、UNC、Google、Meta の研究チームが、Claude Code を使ってアルゴリズム自動探索システム「AutoTTS」を開発し、従来の方法では考え付かないような AI スケーリングアルゴリズムを発見しました。

発見されたアルゴリズムの仕組み

新しいアルゴリズムは「信頼度追跡型」(confidence tracking)という仕組みで動作します。

基本的なロジック

  1. モデルの信頼度を監視 — 回答が確実に見えるかどうかを検証
  2. 信頼度がほぼ同じ場合 — より多くの並列推論経路を開く
  3. 信頼度が急速に上昇した場合 — 新しい経路の開拓をスキップ
  4. 最後に多数決 — 複数の経路から最良の答えを選定

多数派と一致する経路には追加の計算を割き、複数ラウンドで誤った方向に進むと判定された経路のみ削除される仕組みです。

テスト時スケーリング——従来手法との比較

従来の自己一貫性(Self-Consistency)とは

従来の標準的な手法は、同じプロンプトに対して複数回(64個)の並列回答を生成し、多数決で正解を選ぶというものでした。

AutoTTS の成果

新しいアルゴリズムは、この自己一貫性と比べて:

指標削減量
トークン使用量約 70% 削減
精度維持(同等)
開発コスト40 ドル
実行時間160 分

自己一貫性と比べて約 70% のトークン削減を達成しながら、同等の精度を保ち続けています。

AutoTTS(自動テスト時スケーリング)の探索方法

AutoTTS は、アルゴリズムの「幅」(並列経路数)と「深さ」(各経路の長さ)という 2 次元の制御空間でアルゴリズムを自動探索します。

  • Claude Code が複数ラウンドで改良案を提案
  • 各案をテスト環境で実行して性能評価
  • フィードバックに基づいて次の候補を生成

という反復プロセスを通じて、人間の研究者では思いつかないような効率的なアルゴリズムが発見されました。

実用性と今後の展開

新しいアルゴリズムは、オフライン環境で事前に生成された推論経路を使用するため、実装が可能な設計になっています。ただし現在は幅と深さの 2 次元のみに対応しており、より複雑なスケーリング構造への対応はまだ先の課題です。

研究の意義

このプロジェクトが示すことは:

  1. Claude Code の能力 — アルゴリズム設計の自動化が実現段階にある
  2. 計算効率の改善 — テスト時スケーリング領域での大幅なコスト削減が可能
  3. AI による AI 研究 — LLM 自身がより優れた LLM の設計に貢献できる

特に、開発費 40 ドルで 160 分の処理時間という低コストで発見されたという事実は、AI 研究のコスト・効率性が大きく改善されていることを示しています。

まとめ

Claude Code を使った自動アルゴリズム探索は、AI 開発コストの削減と性能の向上を両立させる新しいパラダイムを示唆しています。今後、このようなアプローチがより多くの AI 研究領域で活用される可能性があります。