NVIDIA 研究、AI コーディングエージェントがロボットを自動改善

2026年6月18日 00:12

💡

8台の双腕ロボットが研究論文を読んで学習コードを自動修正。複雑な把握タスクで最大99%成功率を達成し、学習時間を大幅短縮

NVIDIA と Carnegie Mellon University、UC Berkeley による共同研究が、AI コーディングエージェントを活用したロボット自動学習システム「ENPIRE」を発表した。このシステムでは AI エージェントが研究論文を読みながら学習コードを自動修正し、ロボットが複雑な実世界タスクを自己改善する。

ENPIRE の仕組み

ENPIRE は AI コーディングエージェントとロボットハードウェアを結合した研究プロジェクトだ。システムの動作は2つのフェーズに分かれている。

第1フェーズでは、エージェントが人間のフィードバックをもとに作業環境をセットアップする。その過程で安全境界の設定、自動リセット機能、成功判定の自動化を実施する。重要な点として、人間が毎回の試行結果を評価する必要はない。AI エージェントは短時間の動作ビデオだけから独自に報酬関数を書き出す。

第2フェーズは自律的な改善に進む。コーディングエージェントが独立して研究論文を読み、仮説を立てながら訓練コードを修正する。行動クローニングと強化学習のどちらが適切かを実世界のパフォーマンス信号に基づいて判断し、学習戦略を選択する。

実績と性能向上

研究チームは Git バージョン管理で連携する8台の双腕 YAM ロボットを使って検証した。複雑な操作タスク、特にプッシュT試験（T字ブロックをターゲット位置にスライドさせる）、ピン挿入、ケーブルタイ切断、GPU からマザーボードへの取り付けなど多様なテスクで成功率が最大99%に達した。

学習効率も劇的に向上した。プッシュT試験では単一ロボットでの学習時間が約5時間だったのに対し、8台のロボット群を使うと約2時間に短縮。ピン挿入はさらに顕著で、90分以上から約40分へとほぼ半減した。

実世界の課題と制限

ただし、研究チームは重要な制限を明かしている。「現実世界は依然としてシミュレーションより遙かに難しい」という現状だ。検証した3つのエージェント中、2つはシミュレーション環境では成功したものの実環境で失敗した。予測不可能なロボット動特性と摩擦の影響が、シミュ環境での学習成果を実世界で再現できなくなる要因となる。

この研究は、ロボティクスにおける AI エージェントの活用可能性を示すとともに、シミュレーション・実環境ギャップの解決がいまだ重要な課題であることを明示している。

記事をシェア

参考ソース

ロボティクスの記事

Google Deepmind、Gemini Robotics 2 発表——卓上アームから人型ロボットまで、汎用ロボット制御モデル

ロボティクス

2026年8月1日

Google Deepmind、Gemini Robotics 2 発表——卓上アームから人型ロボットまで、汎用ロボット制御モデル

ビジョン言語行動（VLA）モデルの最新版。高度な推論レイヤー Gemini Robotics ER 2 を同時発表。複雑なロボット制御タスクが可能に。

Google Deepmind Gemini Robotics ER 2、リアルタイム推論と複数ロボット協働が可能に

ロボティクス

2026年7月31日

Google Deepmind Gemini Robotics ER 2、リアルタイム推論と複数ロボット協働が可能に

ビデオ理解とツールオーケストレーションを統合。ロボットが環境を認識しながら計画・実行・修正。複数ロボットが共有知識で協力する新境地へ。

日本の『物理AI』時代へ——Nvidia、Cosmos 3 Edge で46社のロボット企業を結集

ロボティクス

2026年7月20日

日本の『物理AI』時代へ——Nvidia、Cosmos 3 Edge で46社のロボット企業を結集

Nvidia の Jensen Huang が日本を訪問。日本政府の AI 戦略 Noetra に参画し、1 兆円規模の官民投資をサポート。ロボティクス企業 46 社が Cosmos 3 Edge を中心に統一プラットフォームを形成し、2028年の Vera Rubin AI Factory 稼働に向けて加速する。