Stanford 大学の研究チームが、複数の AI エージェントで構成されるチーム システムが、従来予想されていたほどの優位性を持たないことを示唆する研究結果を発表した。特に計算リソースが限定された状況下では、単一エージェントの方が効率的である可能性を指摘している。

研究の核心

Stanford の研究者たちが下した結論は単純だが、直感に反している。「単一エージェントとチームが同じ計算予算を受け取る場合、単一エージェントは少なくともと同等かそれ以上のパフォーマンスを発揮する」ということだ。

複数エージェント間の情報引き継ぎ時に、コンテキストが失われ情報損失が生じるのが主要な原因と考えられる。一方、単一エージェントは推論プロセス全体を通じてコンテキストを保持できるため、この問題を回避できる。

実験結果

4 つの言語モデルに対して複数ステップの推論ベンチマークで検証した結果、計算予算が同じ場合、単一エージェントはチームと同等かそれ以上のパフォーマンスを発揮しながら、より少ないリソースを消費した。

重要な例外

研究チームは同時に、この結論には重要な限定条件があることも指摘した。単一エージェントが優位性を発揮するのは理論的には「完璧なコンテキスト処理」が前提の場合であり、実運用ではそうではない。言語モデルは長い推論プロセスで「コンテキストの腐敗」や「隠れた情報の見落とし」(Lost in the Middle 効果)に悩まされるのだ。

入力テキストが意図的に破損された場合、タスク分割により関連情報をより効果的に抽出できるため、マルチエージェント アプローチが優位性を発揮する。また、ベース モデルの能力が低いほどチーム構成の恩恵が大きく、議論アーキテクチャが全体で最強の成果を上げたという。

研究の制限と展望

本研究はテキストベースの推論タスクのみを対象としている。ツール利用や画像処理におけるマルチエージェント システムの有効性は、まだ検証されていない。