Policy-Guided Lazy Search with Feedback for Task and Motion Planning

要約

PDDLStream ソルバーは、タスク アンド モーション プランニング (TAMP) 問題の実行可能なソリューションとして最近登場し、PDDL を連続アクション スペースの問題に拡張します。
これまでの研究では、PDDLStream の問題を一連の PDDL 計画問題にどのように還元し、既製のプランナーを使用して解決できるかを示してきました。
ただし、このアプローチでは実行時間が長くなる可能性があります。
この論文では、アクション スケルトンに対する単一の統合検索を維持する PDDLStream 問題のソルバーである LAZY を提案します。これは、動作計画中に可能な動作のサンプルが遅延的に描画されるため、徐々に幾何学的情報が得られます。
私たちは、目標指向ポリシーの学習済みモデルと現在のモーション サンプリング データを LAZY に組み込んで、タスク プランナーを適応的にガイドする方法を検討します。
これにより、オブジェクト、目標、初期条件の数が異なる目に見えないテスト環境で評価される、実現可能なソリューションの検索が大幅に高速化されることを示します。
一連のシミュレートされた 7DoF 再配置/操作問題に対する PDDLStream 問題の既存のソルバーと比較することにより、TAMP アプローチを評価します。

要約(オリジナル)

PDDLStream solvers have recently emerged as viable solutions for Task and Motion Planning (TAMP) problems, extending PDDL to problems with continuous action spaces. Prior work has shown how PDDLStream problems can be reduced to a sequence of PDDL planning problems, which can then be solved using off-the-shelf planners. However, this approach can suffer from long runtimes. In this paper we propose LAZY, a solver for PDDLStream problems that maintains a single integrated search over action skeletons, which gets progressively more geometrically informed, as samples of possible motions are lazily drawn during motion planning. We explore how learned models of goal-directed policies and current motion sampling data can be incorporated in LAZY to adaptively guide the task planner. We show that this leads to significant speed-ups in the search for a feasible solution evaluated over unseen test environments of varying numbers of objects, goals, and initial conditions. We evaluate our TAMP approach by comparing to existing solvers for PDDLStream problems on a range of simulated 7DoF rearrangement/manipulation problems.

arxiv情報

著者 Mohamed Khodeir,Atharv Sonwane,Ruthrash Hari,Florian Shkurti
発行日 2023-08-23 12:03:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク