Reinforcement Learning with Parameterized Manipulation Primitives for Robotic Assembly

要約

ロボットの組み立てにおける共通のテーマは、通常はステート マシンまたはグラフの形式で、組み立て戦略を構成するための原子的な動作として操作プリミティブを採用することです。
このアプローチは、ますます複雑になる組み立てタスクにおいて優れたパフォーマンスと堅牢性を示していますが、ほとんどの場合、ステート マシンを手動で設計する必要があります。
このようなハードコーディングされた戦略では、設計で考慮されていない予期しない状況に対処できません。
この問題に対処するために、強化学習を通じて操作プリミティブの動的シーケンスを見つけることを提案します。
パラメータ化された操作プリミティブを活用することで、提案された方法は、パラメータ化されていない操作プリミティブを使用した以前の研究と比較して、強化学習のアセンブリパフォーマンスとサンプル効率の両方を大幅に向上させます。
実際に、私たちの方法は、さまざまな形状、クリアランス、および材料を使用した高精度のペグ挿入タスクで、ゼロショットのシミュレーションと実際の優れたパフォーマンスを達成します。

要約(オリジナル)

A common theme in robot assembly is the adoption of Manipulation Primitives as the atomic motion to compose assembly strategy, typically in the form of a state machine or a graph. While this approach has shown great performance and robustness in increasingly complex assembly tasks, the state machine has to be engineered manually in most cases. Such hard-coded strategies will fail to handle unexpected situations that are not considered in the design. To address this issue, we propose to find dynamics sequence of manipulation primitives through Reinforcement Learning. Leveraging parameterized manipulation primitives, the proposed method greatly improves both assembly performance and sample efficiency of Reinforcement Learning compared to a previous work using non-parameterized manipulation primitives. In practice, our method achieves good zero-shot sim-to-real performance on high-precision peg insertion tasks with different geometry, clearance, and material.

arxiv情報

著者 Nghia Vuong,Quang-Cuong Pham
発行日 2023-06-11 13:38:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク