要約
多くの用途では、空間に分散された一連の物体を把握するために移動マニピュレーター ロボットが必要です。
これは単一の基本ポーズからは実現不可能な場合があり、ロボットはすべてのオブジェクトを把握するための基本ポーズのシーケンスを計画し、全体のナビゲーションと把握時間を最小限に抑える必要があります。
これは組み合わせ最適化問題であり、最適解を提供するが計算コストがかかる厳密法、または計算効率は良いが次善の解を提供する近似法を使用して解決できます。
最近の研究では、学習ベースの手法が組み合わせ最適化問題を解決し、最適に近い計算効率の高いソリューションを提供できることが示されています。
この研究では、ロボットがシーン内のすべてのオブジェクトを把握するための基本ポーズのシーケンスを計画する学習ベースのアプローチである BASENET を紹介します。
私たちは、階層化学習を使用して、全体のナビゲーションと把握のコストを最小限に抑えるために、個々のオブジェクトを把握するための基本ポーズとオブジェクトを把握する順序を学習する、強化学習ベースのソリューションを提案します。
問題にはさまざまな数の状態とアクションがあるため、状態とアクションをグラフとして表し、学習にグラフ ニューラル ネットワークを使用します。
提案された方法が、大幅に少ない計算時間で、厳密な方法と近似的な方法に匹敵する解を生成できることを示します。
要約(オリジナル)
In many applications, a mobile manipulator robot is required to grasp a set of objects distributed in space. This may not be feasible from a single base pose and the robot must plan the sequence of base poses for grasping all objects, minimizing the total navigation and grasping time. This is a Combinatorial Optimization problem that can be solved using exact methods, which provide optimal solutions but are computationally expensive, or approximate methods, which offer computationally efficient but sub-optimal solutions. Recent studies have shown that learning-based methods can solve Combinatorial Optimization problems, providing near-optimal and computationally efficient solutions. In this work, we present BASENET – a learning-based approach to plan the sequence of base poses for the robot to grasp all the objects in the scene. We propose a Reinforcement Learning based solution that learns the base poses for grasping individual objects and the sequence in which the objects should be grasped to minimize the total navigation and grasping costs using Layered Learning. As the problem has a varying number of states and actions, we represent states and actions as a graph and use Graph Neural Networks for learning. We show that the proposed method can produce comparable solutions to exact and approximate methods with significantly less computation time.
arxiv情報
著者 | Lakshadeep Naik,Sinan Kalkan,Sune L. Sørensen,Mikkel B. Kjærgaard,Norbert Krüger |
発行日 | 2024-06-12 21:31:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google