Pre- and post-contact policy decomposition for non-prehensile manipulation with zero-shot sim-to-real transfer

要約

我々は、物体を目標位置までうまく操作するために、かなりの回数の接触モード遷移と環境接触の使用を必要とする、把握不可能な操作のためのシステムを提示する。
私たちの手法は深層強化学習に基づいており、最先端の計画アルゴリズムとは異なり、摩擦係数や質量中心などの物体や環境の物理パラメータに関するアプリオリな知識を必要としません。
計画時間は、ニューラル ネットワーク上の単純なフィードフォワード予測時間に短縮されます。
私たちは、効率的な探索とシミュレーションから現実への移行を促進する計算構造、アクション空間設計、カリキュラム学習スキームを提案します。
実世界の把握困難でない操作タスクに挑戦する場合、私たちの方法がさまざまなオブジェクトに対して一般化でき、トレーニング中に見られなかった新しいオブジェクトに対しても成功することを示します。
プロジェクトの Web サイト: https://sites.google.com/view/nonprenehsile-decomposition

要約(オリジナル)

We present a system for non-prehensile manipulation that require a significant number of contact mode transitions and the use of environmental contacts to successfully manipulate an object to a target location. Our method is based on deep reinforcement learning which, unlike state-of-the-art planning algorithms, does not require apriori knowledge of the physical parameters of the object or environment such as friction coefficients or centers of mass. The planning time is reduced to the simple feed-forward prediction time on a neural network. We propose a computational structure, action space design, and curriculum learning scheme that facilitates efficient exploration and sim-to-real transfer. In challenging real-world non-prehensile manipulation tasks, we show that our method can generalize over different objects, and succeed even for novel objects not seen during training. Project website: https://sites.google.com/view/nonprenehsile-decomposition

arxiv情報

著者 Minchan Kim,Junhyek Han,Jaehyung Kim,Beomjoon Kim
発行日 2023-09-06 06:17:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク