Google DeepMind、Gemini Robotics-ER 1.6 を発表——計器読み取り機能を追加
Google DeepMind が、ロボット AI「Gemini Robotics-ER 1.6」を発表。マルチビュー理解と空間推論が強化され、Boston Dynamics との協力で計器読み取り機能を新たに実装。ER 1.5 から大幅な性能向上を実現した。
Google DeepMind は、ロボット向け AI モデル「Gemini Robotics-ER 1.6」を発表した。先代の ER 1.5 と比較して、空間推論とマルチビュー理解の能力が大幅に向上。複雑な物理的タスクの実行性能が高まり、特に計器類の読み取りという新たな機能が加わった。
主要な性能向上
Gemini Robotics-ER 1.6 は、単眼および複数のカメラから同時に入力を処理する能力に優れている。物体の位置特定精度が向上し、複数のカメラ視点での成功検出もより正確になった。指差し動作(ポインティング)による物体特定の精度も改善されている。
従来モデルの ER 1.5 および Gemini 3.0 Flash と比較すると、全般的に性能で上回る。特にビジョン機能を活用したエージェント型の動作では、差が顕著だ。
計器読み取り機能の新実装
Gemini Robotics-ER 1.6 の目玉機能の一つが、アナログおよびデジタル計器の読み取り能力である。この機能は Boston Dynamics との協力を通じて開発された。ロボットが工場設備や実験機器のメーター類を自動で確認し、数値を記録できるようになる。
ビジョンを有効にしたエージェント型の動作では、計器読み取りで 93% の成功率を達成しており、実用的な水準に達している。これにより、ロボットが人間の監視なしに複雑なプロセスを自動化する可能性が広がった。
安全性と制約への対応
Gemini Robotics-ER 1.6 は物理的制約の遵守能力も向上させた。ロボットが作業空間の制限を理解し、危険な動作を避けるよう改善されている。これは製造業や研究施設での導入を視野に入れた設計といえる。
ロボティクス業界では、汎用 AI の物理世界への適用が加速している。DeepMind の取り組みは、実世界のロボット制御における AI の役割がより重要になることを示唆している。