要約
オブジェクトの再配置などのロボット操作タスクは、ロボットが複雑で任意の環境と対話できるようにする上で重要な役割を果たします。
既存の研究は主に単一レベルの再配置計画に焦点を当てており、複数のレベルが存在する場合でも、下部構造間の依存関係は塔の積み重ねのように幾何学的に単純です。
私たちは、グラフ アテンション ネットワークを活用して、構造的な依存関係階層を持つシーンのマルチレベル オブジェクトの再配置計画を実行する深層学習アプローチである構造概念学習 (SCL) を提案します。
これは、直感的な構造を備えた自己生成のシミュレーション データセットでトレーニングされ、任意の数のオブジェクトとより複雑な構造を含む目に見えないシーンで機能し、独立した下部構造を推測して複数のマニピュレーターにわたるタスクの並列化を可能にし、現実世界に一般化します。
私たちの方法をさまざまな古典的およびモデルベースのベースラインと比較して、私たちの方法がシーンの理解を活用してより優れたパフォーマンス、柔軟性、効率を達成していることを示します。
データセット、補足詳細、ビデオ、およびコード実装は、https://manavkulshrestha.github.io/scl から入手できます。
要約(オリジナル)
Robotic manipulation tasks, such as object rearrangement, play a crucial role in enabling robots to interact with complex and arbitrary environments. Existing work focuses primarily on single-level rearrangement planning and, even if multiple levels exist, dependency relations among substructures are geometrically simpler, like tower stacking. We propose Structural Concept Learning (SCL), a deep learning approach that leverages graph attention networks to perform multi-level object rearrangement planning for scenes with structural dependency hierarchies. It is trained on a self-generated simulation data set with intuitive structures, works for unseen scenes with an arbitrary number of objects and higher complexity of structures, infers independent substructures to allow for task parallelization over multiple manipulators, and generalizes to the real world. We compare our method with a range of classical and model-based baselines to show that our method leverages its scene understanding to achieve better performance, flexibility, and efficiency. The dataset, supplementary details, videos, and code implementation are available at: https://manavkulshrestha.github.io/scl
arxiv情報
著者 | Manav Kulshrestha,Ahmed H. Qureshi |
発行日 | 2023-09-05 19:35:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google