PRIME: Scaffolding Manipulation Tasks with Behavior Primitives for Data-Efficient Imitation Learning

要約

模倣学習は、ロボットが複雑な操作動作を獲得できるようにする大きな可能性を示しています。
ただし、これらのアルゴリズムは、長期タスクではサンプルの複雑さが高く、タスクの範囲にわたって複合誤差が蓄積するという問題があります。
我々は、模倣学習のデータ効率を向上させるために設計された動作プリミティブベースのフレームワークである PRIME (PRimitive-based IMitation with data Efficiency) を紹介します。
PRIME は、タスクのデモンストレーションをプリミティブ シーケンスに分解し、続いて模倣学習を通じてプリミティブをシーケンスするための高レベルの制御ポリシーを学習することによってロボット タスクの足場を築きます。
私たちの実験では、PRIME が多段階操作タスクで大幅なパフォーマンス向上を達成し、最先端のベースラインと比較してシミュレーションで 10 ~ 34%、物理ハードウェアで 20 ~ 48% 高い成功率を実現していることが実証されました。

要約(オリジナル)

Imitation learning has shown great potential for enabling robots to acquire complex manipulation behaviors. However, these algorithms suffer from high sample complexity in long-horizon tasks, where compounding errors accumulate over the task horizons. We present PRIME (PRimitive-based IMitation with data Efficiency), a behavior primitive-based framework designed for improving the data efficiency of imitation learning. PRIME scaffolds robot tasks by decomposing task demonstrations into primitive sequences, followed by learning a high-level control policy to sequence primitives through imitation learning. Our experiments demonstrate that PRIME achieves a significant performance improvement in multi-stage manipulation tasks, with 10-34% higher success rates in simulation over state-of-the-art baselines and 20-48% on physical hardware.

arxiv情報

著者 Tian Gao,Soroush Nasiriany,Huihan Liu,Quantao Yang,Yuke Zhu
発行日 2024-03-10 08:55:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク