要約
接触が多い操作は人間の日常活動において重要な役割を果たしますが、不確実なパラメータはロボットが計画と制御を通じて同等のパフォーマンスを達成するために大きな課題を引き起こします。
この問題に対処するために、堅牢なポリシー学習のためにドメイン適応とドメインランダム化が提案されています。
ただし、さまざまなインスタンスにわたる一般化機能が失われるか、インスタンス固有の情報が無視されるために保守的にパフォーマンスが低下します。
この論文では、複数のモデルを使用したパラメータ拡張ポリシー学習と、ドメイン縮小によるパラメータ条件付きポリシー検索を含む、ロバストな操作プリミティブを学習するための 2 レベルのアプローチを提案します。
このアプローチは、ドメインのランダム化とドメインの適応を統合し、汎化能力を維持しながら最適な動作を提供します。
提案された方法を、接触が多い操作プリミティブ (叩く、押す、向きを変える) について検証します。
実験結果は、多様な物理パラメータを持つインスタンスに対して堅牢なポリシーを生成する際の、私たちのアプローチの優れたパフォーマンスを示しています。
要約(オリジナル)
Contact-rich manipulation plays an important role in human daily activities, but uncertain parameters pose significant challenges for robots to achieve comparable performance through planning and control. To address this issue, domain adaptation and domain randomization have been proposed for robust policy learning. However, they either lose the generalization ability across diverse instances or perform conservatively due to neglecting instance-specific information. In this paper, we propose a bi-level approach to learn robust manipulation primitives, including parameter-augmented policy learning using multiple models, and parameter-conditioned policy retrieval through domain contraction. This approach unifies domain randomization and domain adaptation, providing optimal behaviors while keeping generalization ability. We validate the proposed method on three contact-rich manipulation primitives: hitting, pushing, and reorientation. The experimental results showcase the superior performance of our approach in generating robust policies for instances with diverse physical parameters.
arxiv情報
著者 | Teng Xue,Amirreza Razmjoo,Suhan Shetty,Sylvain Calinon |
発行日 | 2024-10-15 13:37:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google