DeepMind· 1分で読める上級🔥 注目
Gemini Robotics 1.5 brings AI agents into the physical world
GoogleがGemini Robotics 1.5を発表しました。視覚情報から直接モーター命令を生成するVLAモデルと、空間推論・複数ステップ計画が可能なVLMモデルが協働し、ロボットが複雑なマルチステップタスクを自律的に実行できるようになります。「ゴミ分別ルール検索→対象物判定→実行」のような、複数の認知・判断・行動が必要なタスク対応が可能です。