Variable-Speed Teaching-Playback as Real-World Data Augmentation for Imitation Learning

要約

模倣学習は、シミュレートが難しい設定での人間のデモに依存しているため、この方法に力制御を含めると、速度が単純に変化しても、データが不足しています。
データの増強分野はデータの不足に対処していますが、ロボット操作のための従来のデータ増強方法は、シミュレーションベースの方法または位置制御のためのダウンサンプリングに限定されています。
このペーパーでは、強制制御に適用可能なデータ増強の新しい方法を提案し、実際のデータセットの利点を保持します。
実際のデータ増強として、さまざまな速度でティーチングプレイバックを適用して、さまざまな速度での環境反応の量と質の両方を向上させました。
位置制御を備えた模倣学習方法を使用した両側制御ベースの模倣学習について実験を行いました。
現実世界のデータ増強が、それぞれが固定速度で2つの人間のデモンストレーションから、さまざまな速度で、ピックアンドプレイスと拭き取りの2つのタスクに対する効果を評価しました。
結果は、さまざまな速度で環境反応を収集することにより、実際の反応の速度の単純な速度の変化と、期間/頻度コマンドに沿った精度の向上から成功率が最大55%増加することを示しました。

要約(オリジナル)

Because imitation learning relies on human demonstrations in hard-to-simulate settings, the inclusion of force control in this method has resulted in a shortage of training data, even with a simple change in speed. Although the field of data augmentation has addressed the lack of data, conventional methods of data augmentation for robot manipulation are limited to simulation-based methods or downsampling for position control. This paper proposes a novel method of data augmentation that is applicable to force control and preserves the advantages of real-world datasets. We applied teaching-playback at variable speeds as real-world data augmentation to increase both the quantity and quality of environmental reactions at variable speeds. An experiment was conducted on bilateral control-based imitation learning using a method of imitation learning equipped with position-force control. We evaluated the effect of real-world data augmentation on two tasks, pick-and-place and wiping, at variable speeds, each from two human demonstrations at fixed speed. The results showed a maximum 55% increase in success rate from a simple change in speed of real-world reactions and improved accuracy along the duration/frequency command by gathering environmental reactions at variable speeds.

arxiv情報

著者 Nozomu Masuya,Hiroshi Sato,Koki Yamane,Takuya Kusume,Sho Sakaino,Toshiaki Tsuji
発行日 2025-05-06 06:54:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク