要約
タスクおよびモーション プランニング (TAMP) フレームワークは、高レベルのタスク プランナーと低レベルのモーション プランナーを統合することで、長く複雑な計画の問題に対処します。
ただし、既存の TAMP 手法は、すべての高レベルのアクションの事前条件と事後条件を指定する計画ドメインの手動設計に大きく依存しています。
この論文では、少数のテスト時の軌跡デモンストレーションから計画領域の推論を自動化し、人間による設計への依存を減らす方法を提案します。
私たちのアプローチには、新しいタスクに適したドメインのコンポーネントを予測する深層学習ベースの推定器と、この予測を改良する検索アルゴリズムが組み込まれており、サイズを削減して、推論されたドメインの有用性を確保します。
私たちの方法では、テスト時に最小限のデモンストレーションから新しいドメインを生成でき、ロボットが複雑なタスクをより効率的に処理できるようになります。
私たちのアプローチは、さまざまなタスクにわたる計画のパフォーマンスと一般化の点で、プランナーの動作を直接模倣する動作クローニング ベースラインよりも優れていることを示します。
さらに、私たちの方法は、新しい計画ドメインを推論するためのテスト時の計算コストとデータ量の要件を削減します。
要約(オリジナル)
Task and motion planning (TAMP) frameworks address long and complex planning problems by integrating high-level task planners with low-level motion planners. However, existing TAMP methods rely heavily on the manual design of planning domains that specify the preconditions and postconditions of all high-level actions. This paper proposes a method to automate planning domain inference from a handful of test-time trajectory demonstrations, reducing the reliance on human design. Our approach incorporates a deep learning-based estimator that predicts the appropriate components of a domain for a new task and a search algorithm that refines this prediction, reducing the size and ensuring the utility of the inferred domain. Our method is able to generate new domains from minimal demonstrations at test time, enabling robots to handle complex tasks more efficiently. We demonstrate that our approach outperforms behavior cloning baselines, which directly imitate planner behavior, in terms of planning performance and generalization across a variety of tasks. Additionally, our method reduces computational costs and data amount requirements at test time for inferring new planning domains.
arxiv情報
著者 | Jinbang Huang,Allen Tao,Rozilyn Marco,Miroslav Bogdanovic,Jonathan Kelly,Florian Shkurti |
発行日 | 2024-10-21 19:15:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google