Waypoint-Based Imitation Learning for Robotic Manipulation

要約

模倣学習法によりロボット操作への関心が再び高まっていますが、複合エラーというよく知られた問題が行動クローニング (BC) を悩ませ続けています。
ウェイポイントは、BC の学習問題の範囲を狭めることで、この問題に対処するのに役立ちます。したがって、時間の経過とともにエラーが悪化します。
ただし、ウェイポイントのラベル付けは仕様が不十分であり、人間による追加の監視が必要です。
人間による追加の監視なしでウェイポイントを自動的に生成できますか?
私たちの重要な洞察は、軌道セグメントを直線運動で近似できる場合、エンドポイントをウェイポイントとして使用できるということです。
私たちは、模倣学習のための自動ウェイポイント抽出 (AWE) を提案します。これは、デモンストレーションを最小限のウェイポイントのセットに分解する前処理モジュールであり、線形補間すると、指定された誤差しきい値まで軌道を近似できます。
AWE は任意の BC アルゴリズムと組み合わせることができ、AWE は最先端のアルゴリズムの成功率をシミュレーションで最大 25%、現実世界の両手操作タスクで 4 ~ 28% 向上させることができることがわかりました。
意思決定の期間が最大 10 倍になります。ビデオとコードは https://lucys0.github.io/awe/ で入手できます。

要約(オリジナル)

While imitation learning methods have seen a resurgent interest for robotic manipulation, the well-known problem of compounding errors continues to afflict behavioral cloning (BC). Waypoints can help address this problem by reducing the horizon of the learning problem for BC, and thus, the errors compounded over time. However, waypoint labeling is underspecified, and requires additional human supervision. Can we generate waypoints automatically without any additional human supervision? Our key insight is that if a trajectory segment can be approximated by linear motion, the endpoints can be used as waypoints. We propose Automatic Waypoint Extraction (AWE) for imitation learning, a preprocessing module to decompose a demonstration into a minimal set of waypoints which when interpolated linearly can approximate the trajectory up to a specified error threshold. AWE can be combined with any BC algorithm, and we find that AWE can increase the success rate of state-of-the-art algorithms by up to 25% in simulation and by 4-28% on real-world bimanual manipulation tasks, reducing the decision making horizon by up to a factor of 10. Videos and code are available at https://lucys0.github.io/awe/

arxiv情報

著者 Lucy Xiaoyang Shi,Archit Sharma,Tony Z. Zhao,Chelsea Finn
発行日 2023-07-26 17:45:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク