Learning Efficient Abstract Planning Models that Choose What to Predict

要約

連続的な状態空間とアクション空間を持つロボット工学ドメインにおける長期タスクを解決するための効果的なアプローチは、環境の抽象化に対する高レベルの検索を使用して低レベルの意思決定をガイドする、バイレベル計画です。
最近の研究では、記号演算子とニューラル サンプラーの形式で抽象モデルを学習することで、このような 2 レベルの計画を可能にする方法が示されています。
この研究では、ロボットの動作が抽象状態に多数の無関係な変化を引き起こす傾向がある多くのロボット工学領域において、既存の記号オペレーター学習アプローチでは不十分であることを示します。
これは主に、抽象状態で観察されたすべての変化を正確に予測する演算子を学習しようとするためです。
この問題を克服するために、指定された目標を達成するための抽象的な計画に必要な変更のみをモデル化することによって、「何を予測するかを選択する」演算子を学習することを提案します。
実験的に、私たちのアプローチは、新しい初期状態、目標、オブジェクトに一般化しながら、難関の BEHAVIOR-100 ベンチマークからの 4 つを含む、10 の異なるハイブリッド ロボティクス ドメインにわたる効率的な計画につながる演算子を学習することを示します。

要約(オリジナル)

An effective approach to solving long-horizon tasks in robotics domains with continuous state and action spaces is bilevel planning, wherein a high-level search over an abstraction of an environment is used to guide low-level decision-making. Recent work has shown how to enable such bilevel planning by learning abstract models in the form of symbolic operators and neural samplers. In this work, we show that existing symbolic operator learning approaches fall short in many robotics domains where a robot’s actions tend to cause a large number of irrelevant changes in the abstract state. This is primarily because they attempt to learn operators that exactly predict all observed changes in the abstract state. To overcome this issue, we propose to learn operators that ‘choose what to predict’ by only modelling changes necessary for abstract planning to achieve specified goals. Experimentally, we show that our approach learns operators that lead to efficient planning across 10 different hybrid robotics domains, including 4 from the challenging BEHAVIOR-100 benchmark, while generalizing to novel initial states, goals, and objects.

arxiv情報

著者 Nishanth Kumar,Willie McClinton,Rohan Chitnis,Tom Silver,Tomás Lozano-Pérez,Leslie Pack Kaelbling
発行日 2023-09-05 16:22:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク