MITが挑む画像からロボ計画を作るAI
MITの新AIプランナーは視覚言語モデルで画像を理解し行動候補を生成、別モデルがそれをプログラム言語に翻訳して実行可能な計画に仕上げる技術で、報告では従来法の約2倍の効果が示されており、デモ公開が期待されています。
続きを読むMITの新AIプランナーは視覚言語モデルで画像を理解し行動候補を生成、別モデルがそれをプログラム言語に翻訳して実行可能な計画に仕上げる技術で、報告では従来法の約2倍の効果が示されており、デモ公開が期待されています。
続きを読むMITの研究は、音声指示をAIがロボット用作業指示に変換して家具を約5分で現物化する実証を示し、企業の試作短縮や個人のオンデマンド製作を後押しする一方で、実運用には長期的な信頼性検証と規制・倫理整備が不可欠です。
続きを読む