PRIME: Scaffolding Manipulation Tasks with Behavior Primitives for Data-Efficient Imitation Learning

要約

模倣学習は、ロボットが複雑な操作行動を習得するための大きな可能性を示している。しかし、これらのアルゴリズムは、複合誤差がタスクのホライズンにわたって蓄積されるような長いホライズンのタスクにおいて、高いサンプル複雑性に悩まされている。我々は、模倣学習のデータ効率を改善するために設計された行動プリミティブベースのフレームワークであるPRIME(PRimitive-based IMitation with data Efficiency)を発表する。PRIMEは、タスクのデモンストレーションをプリミティブなシーケンスに分解することによりロボットタスクを足場化し、その後、模倣学習によりプリミティブをシーケンス化するためのハイレベルな制御ポリシーを学習する。我々の実験では、PRIMEが多段階操作タスクにおいて大幅な性能向上を達成し、シミュレーションでは最新のベースラインよりも10~34%、物理的ハードウェアでは20~48%高い成功率を示した。

要約(オリジナル)

Imitation learning has shown great potential for enabling robots to acquire complex manipulation behaviors. However, these algorithms suffer from high sample complexity in long-horizon tasks, where compounding errors accumulate over the task horizons. We present PRIME (PRimitive-based IMitation with data Efficiency), a behavior primitive-based framework designed for improving the data efficiency of imitation learning. PRIME scaffolds robot tasks by decomposing task demonstrations into primitive sequences, followed by learning a high-level control policy to sequence primitives through imitation learning. Our experiments demonstrate that PRIME achieves a significant performance improvement in multi-stage manipulation tasks, with 10-34% higher success rates in simulation over state-of-the-art baselines and 20-48% on physical hardware.

arxiv情報

著者 Tian Gao,Soroush Nasiriany,Huihan Liu,Quantao Yang,Yuke Zhu
発行日 2024-03-01 19:19:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク