STAMP: Differentiable Task and Motion Planning via Stein Variational Gradient Descent

要約

工具の使用や部品の組み立てなど、多くの操作タスクの計画には、記号的推論と幾何学的推論の両方が必要になることが多い。タスク&モーションプランニング(TAMP)アルゴリズムは、一般的に、運動学的および動的な実行可能性をチェックしながら、高レベルのタスクシーケンスに対してツリー探索を行うことによって、これらの問題を解決します。性能は高いものの、既存のアルゴリズムのほとんどは、可能なアクションとオブジェクトの数に応じて指数関数的に複雑さが増大するため、非常に非効率的です。さらに、多くの実行可能な計画が存在する可能性のある問題に対して、単一の解しか見つけられない。これらの限界に対処するために、我々は、並列化と微分可能なシミュレーションを活用して、複数の多様な計画を効率的に探索する、Stein Task and Motion Planning(STAMP)と呼ばれる新しいアルゴリズムを提案する。STAMPは、離散的かつ連続的なTAMP問題を、変分推論を用いて解くことのできる連続最適化問題に緩和する。我々のアルゴリズムは、勾配ベースの変分推論アルゴリズムであるStein Variational Gradient Descentと、GPU上で並列化された微分可能な物理シミュレータを基に構築されており、推論のための勾配を効率的に求めることができる。さらに、推論問題を低次元化するアクション抽象化を導入するために模倣学習を採用する。本手法を2つのTAMP問題で実証し、STAMPが以下のことが可能であることを経験的に示す:1)複数の多様な計画を並列に生成する、2)既存のTAMPベースラインと比較して、より効率的に計画を探索する。

要約(オリジナル)

Planning for many manipulation tasks, such as using tools or assembling parts, often requires both symbolic and geometric reasoning. Task and Motion Planning (TAMP) algorithms typically solve these problems by conducting a tree search over high-level task sequences while checking for kinematic and dynamic feasibility. While performant, most existing algorithms are highly inefficient as their time complexity grows exponentially with the number of possible actions and objects. Additionally, they only find a single solution to problems in which many feasible plans may exist. To address these limitations, we propose a novel algorithm called Stein Task and Motion Planning (STAMP) that leverages parallelization and differentiable simulation to efficiently search for multiple diverse plans. STAMP relaxes discrete-and-continuous TAMP problems into continuous optimization problems that can be solved using variational inference. Our algorithm builds upon Stein Variational Gradient Descent, a gradient-based variational inference algorithm, and parallelized differentiable physics simulators on the GPU to efficiently obtain gradients for inference. Further, we employ imitation learning to introduce action abstractions that reduce the inference problem to lower dimensions. We demonstrate our method on two TAMP problems and empirically show that STAMP is able to: 1) produce multiple diverse plans in parallel; and 2) search for plans more efficiently compared to existing TAMP baselines.

arxiv情報

著者 Yewon Lee,Philip Huang,Krishna Murthy Jatavallabhula,Andrew Z. Li,Fabian Damken,Eric Heiden,Kevin Smith,Derek Nowrouzezahrai,Fabio Ramos,Florian Shkurti
発行日 2023-10-03 03:53:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.RO, I.2.9 パーマリンク