要約
人間によるデモンストレーションからロボットが動作を学習できるようにする模倣学習は、このような環境でロボットの動作を生成するための有望なソリューションとして浮上しています。
しかし、模倣学習によるロボット動作生成手法には、デモンストレーターのタスク実行速度に依存してしまうという欠点があります。
この論文では、将来のアクションの実行を可能にする、模倣学習アルゴリズムに適用される新しい時間アンサンブル アプローチを紹介します。
提案された方法は、既存のデモンストレーション データと事前トレーニングされたポリシーを活用しており、追加の計算が不要で実装が簡単であるという利点があります。
アルゴリズムのパフォーマンスは、ロボットによるブロックのカラー分類を伴う実世界の実験を通じて検証され、トランスフォーマー手法によるアクションチャンク化と比較して、高い成功率を維持しながらタスクの実行速度が最大 3 倍向上することが実証されました。
この研究は、これまでデモンストレーターの速度によって制限されていた模倣学習ベースのポリシーのパフォーマンスを大幅に向上させる可能性を強調しています。
今後の生産性向上を目的とした自律物体操作技術の進歩に大きく貢献すると期待されています。
要約(オリジナル)
Imitation learning, which enables robots to learn behaviors from demonstrations by human, has emerged as a promising solution for generating robot motions in such environments. The imitation learning-based robot motion generation method, however, has the drawback of depending on the demonstrator’s task execution speed. This paper presents a novel temporal ensemble approach applied to imitation learning algorithms, allowing for execution of future actions. The proposed method leverages existing demonstration data and pre-trained policies, offering the advantages of requiring no additional computation and being easy to implement. The algorithms performance was validated through real-world experiments involving robotic block color sorting, demonstrating up to 3x increase in task execution speed while maintaining a high success rate compared to the action chunking with transformer method. This study highlights the potential for significantly improving the performance of imitation learning-based policies, which were previously limited by the demonstrator’s speed. It is expected to contribute substantially to future advancements in autonomous object manipulation technologies aimed at enhancing productivity.
arxiv情報
著者 | Hyeonjun Park,Daegyu Lim,Seungyeon Kim,Sumin Park |
発行日 | 2024-11-13 02:49:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google