Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

2026年4月22日 02:11

💡

Google AI が新しいメモリフレームワーク『ReasoningBank』を発表。エージェントが成功と失敗の両方の経験から推論戦略を学習し、継続的に性能を向上させることで、WebArena で 8.3%、SWE-Bench-Verified で 4.6% の成功率改善を実現。

ReasoningBank とは

Google AI Research が発表した ReasoningBank は、AI エージェントが展開後の実務経験から動的に学習できるメモリフレームワークです。これにより、エージェントは反復を重ねるごとに性能を改善し、より複雑で予防的な推論戦略を習得できます。

従来のエージェント向けメモリシステムが学習の対象としてこなかったもの――すなわち失敗事例や予防的洞察――を活用することで、実運用での実用性が格段に向上しています。

技術的な仕組み

メモリ構造

ReasoningBank のメモリアイテムは以下の 3 要素で構成されています:

タイトル: メモリの概略を一文で表現
説明: コンテキストと応用可能な状況を説明
内容: 具体的な推論戦略や手順

従来のメモリシステムが「次にこの操作を実行する」といった手順的ルール（チェックリスト）を保存していたのに対し、ReasoningBank は戦略的で適応的な論理を保存する点が特徴です。

成功と失敗の両面学習

ReasoningBank の革新的な点は、エージェントが失敗からも学習することです。実例を挙げると:

「結果をロードする前に、現在のページ識別子を常に確認し、無限スクロールトラップを回避する」

このような予防的洞察は、失敗を経験することでのみ体得できます。成功事例だけからは、こうした「落とし穴を避ける方法」は学習できません。

Memory-aware Test-Time Scaling (MaTTS)

ReasoningBank には、探索軌跡を高品質なメモリに変換するための仕組みが組み込まれています:

並列スケーリング: 複数の探索経路を同時進行
逐次スケーリング: 段階的に推論を深掘り

これにより、エージェントは単なる試行錯誤ではなく、体系的かつ効率的に学習を進めることができます。

ベンチマーク結果

ReasoningBank の実装により、複数の難易度の高いタスク環境で成功率の改善が確認されました:

ベンチマーク	改善率	説明
WebArena	8.3% 向上	Web ナビゲーション・複雑な購入フロー等の自動実行
SWE-Bench-Verified	4.6% 向上	ソフトウェア開発支援（バグ修正・機能実装）

これらの成績向上に加え、エージェントが実行ステップ数を削減しながら目標を達成できるようになったことも報告されています。

ビジネスと実装への影響

実務応用の拡大

ReasoningBank により、以下の領域での AI エージェント活用が現実的になります:

Web 自動化: E コマース、登録フロー、データ取得などの複雑なナビゲーション
ソフトウェア開発支援: コードレビュー、バグ修正、テスト実装の自動化
顧客対応: 複雑なトラブルシューティングの自動化

エージェント設計への示唆

これまでのエージェント開発では、失敗ケースは単に「ログに記録する」程度に扱われていました。ReasoningBank は失敗こそが最高の教材という逆転の発想を実装しており、エージェント設計におけるパラダイムシフトを示しています。

見どころ

Google のこの発表は、AI エージェント技術が「完璧さを目指すモデル」から「経験により改善するシステム」へと進化していることを示唆しています。継続学習の仕組みが組み込まれたエージェントは、実運用での適応性と信頼性が格段に高まり、ビジネス適用の範囲が大幅に拡大する可能性があります。

記事をシェア

参考ソース

★ 注目 Google AI Blog

LLM・生成AIの記事

Alibaba が Qwen 3.8 発表、「Fable 5 に次ぐ」マルチモーダル AI モデル

LLM・生成AI

2026年7月19日

Alibaba が Qwen 3.8 発表、「Fable 5 に次ぐ」マルチモーダル AI モデル

Alibaba の Qwen チームが 2.4 兆パラメータのマルチモーダルモデル Qwen 3.8 をリリース。画像・動画・ドキュメント対応で、開発チームは Fable 5 に次ぐ性能を主張。プレビューは Token Plan で利用可能、オープンウェイト版は近日公開予定。

Google Gemini の使用量枠が仕様変更——計算方法が変わり、従来より少ない回答数に

LLM・生成AI

2026年7月18日

Google Gemini の使用量枠が仕様変更——計算方法が変わり、従来より少ない回答数に

Google は Gemini の使用量枠（クォータ）の計算方法を変更。従来の計算ロジックから切り替わり、同じプランでも利用できる回答数が減少する可能性が出現。有料プランユーザーに事前告知なく適用されるため注意が必要。

オープンソースAI 2026：能力格差3.3%、コスト50分の1、Mozillaが示した「使える時代」の全貌

LLM・生成AI

2026年7月18日

オープンソースAI 2026：能力格差3.3%、コスト50分の1、Mozillaが示した「使える時代」の全貌

Mozilla が2026年7月に公開した『State of Open Source AI』レポートが、AI業界に衝撃を与えている。クローズドモデルとの能力格差は3.3%まで縮小し、GPT-4相当の推論コストは3年で50分の1に。中国モデルが週間トラフィックの45%超を占め、ローカルLLMはもはや「使えるツール」となった実態を徹底解説する。

Google、学術研究支援の AI エージェント 2 つを発表——論文作成と査読を自動化

Google は論文の図表自動生成と査読を行う 2 つの AI エージェントを発表。研究者の負担軽減と査読の効率化を実現する。

Google、Gemini API Managed Agents に背景実行・MCP サポート――非同期処理で開発効率が飛躍

テクノロジー

2026年7月9日

Google、Gemini API Managed Agents に背景実行・MCP サポート――非同期処理で開発効率が飛躍

Google Deepmind は Gemini API の Managed Agents に 4 つの新機能を追加。バックグラウンド実行（非同期）、リモート MCP サーバー接続、カスタム関数の統合、認証情報のリフレッシュを実現。開発者は HTTP 接続を保持せずにエージェントを運用できるように

Claude Sonnet 5 完全活用ガイド——エージェントAIで仕事を自動化する実践的な使い方

LLM・生成AI

2026年7月4日

Claude Sonnet 5 完全活用ガイド——エージェントAIで仕事を自動化する実践的な使い方

Anthropicが6月30日にリリースした「Claude Sonnet 5」は、ブラウザやターミナルを自律操作し、複数ステップの業務フローを完走できる「エージェント特化モデル」だ。Opus 4.8に迫る性能をFreeプランから試せる本モデルの実践的な使い方と、今日から始められる5つのユースケースを徹底解説する。

Google、2028年に Frozen v2 チップ投入——Gemini アーキテクチャをシリコンに組み込んで推論コストを革命化

Google が開発中の専用サーバーチップ『Frozen v2』は、Gemini のニューラルネットワークアーキテクチャを直接ハードウェアに実装。現行の TPU 比で6～10倍の推論効率を実現し、OpenAI・Anthropic との AI インフラ競争の構図を大きく変える可能性がある。

Google AI チップ Gemini 推論コスト TPU

Microsoft が Azure に AMD Helios を導入――Nvidia 独占に変化、Anthropic も AMD テスト

テクノロジー

2026年7月21日

Microsoft が Azure に AMD Helios を導入――Nvidia 独占に変化、Anthropic も AMD テスト

Microsoft が Azure インフラに AMD の Helios プラットフォームを採用し、Anthropic が公開リポジトリで AMD テストを実施。Nvidia の AI チップ市場における支配力が弱まり始めています。

Nvidia AMD Anthropic Microsoft Azure AI インフラ

Model Context Protocol がステートレス化で大規模統合を加速——セッション管理の刷新がもたらすコスト削減とスケーリング改革

テクノロジー

2026年7月21日

Model Context Protocol がステートレス化で大規模統合を加速——セッション管理の刷新がもたらすコスト削減とスケーリング改革

MCP（Model Context Protocol）の新バージョンがセッションID処理をステートレス化。従来のハンドシェイク方式から標準的なウェブ技術へ転換することで、エンタープライズ向け MCP サーバーの構築・運用コストが大幅に削減される。

Model Context Protocol MCP API AIインテグレーションエンタープライズ開発

Trump 政権が中国AIを段階的に排除へ――制裁リスト登録・企業責任化で『事実上のバン』を検討

政策・規制

2026年7月21日

Trump 政権が中国AIを段階的に排除へ――制裁リスト登録・企業責任化で『事実上のバン』を検討

Trump 政権がNSA・商務省と連携して、中国AI企業への規制フレームワークを構築中。直接禁止ではなく、制裁脅迫・調達ルール・セキュリティ警告を組み合わせ、米国企業の市場支配力を維持する戦略。

Trump 中国AI 規制ジオポリティクス制裁

Hugging Face がAIエージェントハッキング被害、防御側もAIの課題露呈

セキュリティ

2026年7月20日

Hugging Face がAIエージェントハッキング被害、防御側もAIの課題露呈

Hugging Face は2026年7月、自律型AIエージェントによるサイバー攻撃を受けた。17,000以上の攻撃アクションが記録されたが、公開モデルへの被害はなし。防御側がAI使用時のセーフティフィルター問題も浮き彫りに。

セキュリティ AIエージェント HuggingFace サイバー攻撃

日本の『物理AI』時代へ——Nvidia、Cosmos 3 Edge で46社のロボット企業を結集

ロボティクス

2026年7月20日

日本の『物理AI』時代へ——Nvidia、Cosmos 3 Edge で46社のロボット企業を結集

Nvidia の Jensen Huang が日本を訪問。日本政府の AI 戦略 Noetra に参画し、1 兆円規模の官民投資をサポート。ロボティクス企業 46 社が Cosmos 3 Edge を中心に統一プラットフォームを形成し、2028年の Vera Rubin AI Factory 稼働に向けて加速する。

Nvidia Cosmos 3 Edge ロボティクス日本物理AI

すべての記事を見る

Google、ReasoningBank を発表――AI エージェントが経験から学習できるメモリフレームワーク

ReasoningBank とは