Proleptic Temporal Ensemble for Improving the Speed of Robot Tasks Generated by Imitation Learning

要約

非専門家によるデモンストレーションからロボットが動作を学習できるようにする模倣学習は、このような環境でロボットの動作を生成するための有望なソリューションとして浮上しています。
しかし、模倣学習ベースのロボット動作生成方法には、デモンストレーターのタスク実行速度によって制限されるという欠点があります。
この論文では、将来のアクションの実行を可能にする、模倣学習アルゴリズムに適用される新しい時間アンサンブル アプローチを紹介します。
提案された方法は、既存のデモンストレーション データと事前トレーニングされたポリシーを活用しており、追加の計算が不要で実装が簡単であるという利点があります。
アルゴリズムのパフォーマンスは、ロボットによるブロックのカラー分類を伴う現実世界の実験を通じて検証され、トランスフォーマー方式によるアクションチャンク化と比較して、高い成功率を維持しながらタスクの実行速度が最大 3 倍向上することが実証されました。
この研究は、これまでデモンストレーターの速度によって制限されていた模倣学習ベースのポリシーのパフォーマンスを大幅に向上させる可能性を強調しています。
今後の生産性向上を目的とした自律物体操作技術の進歩に大きく貢献すると期待されています。

要約(オリジナル)

Imitation learning, which enables robots to learn behaviors from demonstrations by non-experts, has emerged as a promising solution for generating robot motions in such environments. The imitation learning based robot motion generation method, however, has the drawback of being limited by the demonstrators task execution speed. This paper presents a novel temporal ensemble approach applied to imitation learning algorithms, allowing for execution of future actions. The proposed method leverages existing demonstration data and pretrained policies, offering the advantages of requiring no additional computation and being easy to implement. The algorithms performance was validated through real world experiments involving robotic block color sorting, demonstrating up to 3x increase in task execution speed while maintaining a high success rate compared to the action chunking with transformer method. This study highlights the potential for significantly improving the performance of imitation learning-based policies, which were previously limited by the demonstrator’s speed. It is expected to contribute substantially to future advancements in autonomous object manipulation technologies aimed at enhancing productivity.

arxiv情報

著者 Hyeonjun Park,Daegyu Lim,Seungyeon Kim,Sumin Park
発行日 2024-10-22 13:01:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク