Efficient Object Manipulation Planning with Monte Carlo Tree Search

要約

この論文では、モンテカルロ ツリー検索 (MCTS) を使用して接触シーケンスを見つけ、効率的な ADMM ベースの軌道最適化アルゴリズムを使用して候補接触シーケンスの動的実現可能性を評価する、オブジェクト操作計画への効率的なアプローチを示します。
MCTSを加速するために、目標条件付きのポリシー値ネットワークを学習して、検索を有望なノードに向ける方法を提案します。
さらに、操作固有のヒューリスティックにより、検索スペースを大幅に削減できます。
物理シミュレーターと実際のハードウェアでの体系的なオブジェクト操作実験は、私たちのアプローチの効率を示しています。
特に、私たちのアプローチは、学習されたポリシー値ネットワークのおかげで、長い操作シーケンスに対して有利にスケーリングされ、計画の成功率が大幅に向上します。

要約(オリジナル)

This paper presents an efficient approach to object manipulation planning using Monte Carlo Tree Search (MCTS) to find contact sequences and an efficient ADMM-based trajectory optimization algorithm to evaluate the dynamic feasibility of candidate contact sequences. To accelerate MCTS, we propose a methodology to learn a goal-conditioned policy-value network to direct the search towards promising nodes. Further, manipulation-specific heuristics enable to drastically reduce the search space. Systematic object manipulation experiments in a physics simulator and on real hardware demonstrate the efficiency of our approach. In particular, our approach scales favorably for long manipulation sequences thanks to the learned policy-value network, significantly improving planning success rate.

arxiv情報

著者 Huaijiang Zhu,Avadesh Meduri,Ludovic Righetti
発行日 2023-03-19 21:16:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク