GenORM: Generalizable One-shot Rope Manipulation with Parameter-Aware Policy

要約

動作中のロープの変形性に固有の不確実性があるため、ロープ操作のこれまでの方法では、ロープのゴール到達などの単純なタスクであっても、各ロープの操作ポリシーをトレーニングするために何百もの実際のデモンストレーションが必要になることが多く、これが私たちの分野での応用を妨げています。
-変わりゆく世界。
この問題に対処するために、操作ポリシーが単一の実世界のデモンストレーションでさまざまな変形可能なロープを処理できるようにするフレームワークである GenORM を導入します。
これを達成するために、変形可能なロープ パラメータに基づいてポリシーを条件付けし、さまざまなシミュレートされた変形可能なロープを使用してポリシーをトレーニングすることでポリシーを強化し、ポリシーがさまざまなロープ パラメータに基づいてアクションを調整できるようにします。
推論時に、新しいロープが与えられると、GenORM は、現実世界のデモンストレーションとシミュレーションの点群のグリッド密度間の差異を最小限に抑えることによって、変形可能なロープのパラメーターを推定します。
微分可能な物理シミュレーターの助けを借りて、必要な実世界のデモンストレーションは 1 つだけです。
シミュレートされたロープ操作セットアップと現実世界のロープ操作セットアップの両方での経験的検証は、私たちの方法が 1 回のデモン​​ストレーションでさまざまなロープを操作でき、両方の環境でベースラインを大幅に上回っていることを明確に示しています (ドメイン内ロープで 62% 改善、ドメイン外ロープで 15% 改善)。
シミュレーションでは分配ロープの割合が 26%、現実世界では 26% 向上)、ワンショット ロープ操作におけるアプローチの有効性を示しています。

要約(オリジナル)

Due to the inherent uncertainty in their deformability during motion, previous methods in rope manipulation often require hundreds of real-world demonstrations to train a manipulation policy for each rope, even for simple tasks such as rope goal reaching, which hinder their applications in our ever-changing world. To address this issue, we introduce GenORM, a framework that allows the manipulation policy to handle different deformable ropes with a single real-world demonstration. To achieve this, we augment the policy by conditioning it on deformable rope parameters and training it with a diverse range of simulated deformable ropes so that the policy can adjust actions based on different rope parameters. At the time of inference, given a new rope, GenORM estimates the deformable rope parameters by minimizing the disparity between the grid density of point clouds of real-world demonstrations and simulations. With the help of a differentiable physics simulator, we require only a single real-world demonstration. Empirical validations on both simulated and real-world rope manipulation setups clearly show that our method can manipulate different ropes with a single demonstration and significantly outperforms the baseline in both environments (62% improvement in in-domain ropes, and 15% improvement in out-of-distribution ropes in simulation, 26% improvement in real-world), demonstrating the effectiveness of our approach in one-shot rope manipulation.

arxiv情報

著者 So Kuroki,Jiaxian Guo,Tatsuya Matsushima,Takuya Okubo,Masato Kobayashi,Yuya Ikeda,Ryosuke Takanami,Paul Yoo,Yutaka Matsuo,Yusuke Iwasawa
発行日 2023-06-20 03:31:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク