Partially Observable Task and Motion Planning with Uncertainty and Risk Awareness

要約

統合タスクおよび動作計画 (TAMP) は、一般化可能な長期的なロボットの操作およびナビゲーションの問題に対する貴重なアプローチであることが証明されています。
ただし、典型的な TAMP 問題の定式化では、完全な可観測性と決定論的なアクション効果が想定されています。
これらの仮定により、プランナーが情報を収集し、リスクを認識した意思決定を行う能力が制限されます。
我々は、情報収集や望ましくない不可逆的な結果の回避を必要とする問題など、初期状態と行動結果の不確実性を伴う長期計画の問題を効率的に解決できる、不確実性とリスク認識を備えた TAMP (TAMPURA) の戦略を提案します。
私たちのプランナーは、抽象タスク レベルと継続的コントローラー レベルの両方で不確実性を考慮して推論します。
プリミティブ アクション空間で動作する一連の閉ループの目標条件付きコントローラーと、それらの前提条件と潜在的な機能の説明が与えられると、効率的に解決して実行のための連続アクションに洗練できる高レベルの抽象化を学習します。
我々は、不確実性が重要な要素であるいくつかのロボット工学問題に対するアプローチを実証し、これらの問題における不確実性の下での推論が、以前に提案された決定化計画、直接探索、および強化学習戦略よりも優れていることを示します。
最後に、最近の確率的認識の進歩を使用して、現実世界の 2 つのロボット工学の問題についてプランナーをデモンストレーションします。

要約(オリジナル)

Integrated task and motion planning (TAMP) has proven to be a valuable approach to generalizable long-horizon robotic manipulation and navigation problems. However, the typical TAMP problem formulation assumes full observability and deterministic action effects. These assumptions limit the ability of the planner to gather information and make decisions that are risk-aware. We propose a strategy for TAMP with Uncertainty and Risk Awareness (TAMPURA) that is capable of efficiently solving long-horizon planning problems with initial-state and action outcome uncertainty, including problems that require information gathering and avoiding undesirable and irreversible outcomes. Our planner reasons under uncertainty at both the abstract task level and continuous controller level. Given a set of closed-loop goal-conditioned controllers operating in the primitive action space and a description of their preconditions and potential capabilities, we learn a high-level abstraction that can be solved efficiently and then refined to continuous actions for execution. We demonstrate our approach on several robotics problems where uncertainty is a crucial factor and show that reasoning under uncertainty in these problems outperforms previously proposed determinized planning, direct search, and reinforcement learning strategies. Lastly, we demonstrate our planner on two real-world robotics problems using recent advancements in probabilistic perception.

arxiv情報

著者 Aidan Curtis,George Matheos,Nishad Gothoskar,Vikash Mansinghka,Joshua Tenenbaum,Tomás Lozano-Pérez,Leslie Pack Kaelbling
発行日 2024-03-15 16:42:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク