要約
私たちは、単一のデモンストレーションから複雑な目標条件付きロボットタスクを学習するための新しい方法である WayEx を提案します。
私たちのアプローチは、専門家の例を少なくし、デモンストレーション中に行われたアクションに関する情報の必要性を排除することで、既存の模倣学習方法とは異なります。
これは、新しい報酬関数を導入し、知識拡張手法を採用することによって実現されます。
6 つの多様なタスクにわたってウェイポイント探索戦略である WayEx の有効性を実証し、さまざまな環境での適用可能性を示します。
特に、私たちの方法では、従来の強化学習方法と比較してトレーニング時間が 50% 大幅に短縮されます。
WayEx は、1 回のデモンストレーションのみで、既存の模倣学習方法よりも高い報酬を獲得します。
さらに、標準的なアプローチでは不十分な複雑な環境への取り組みにおいてもその成功を実証します。
詳細については、https://waypoint-ex.github.io を参照してください。
要約(オリジナル)
We propose WayEx, a new method for learning complex goal-conditioned robotics tasks from a single demonstration. Our approach distinguishes itself from existing imitation learning methods by demanding fewer expert examples and eliminating the need for information about the actions taken during the demonstration. This is accomplished by introducing a new reward function and employing a knowledge expansion technique. We demonstrate the effectiveness of WayEx, our waypoint exploration strategy, across six diverse tasks, showcasing its applicability in various environments. Notably, our method significantly reduces training time by 50% as compared to traditional reinforcement learning methods. WayEx obtains a higher reward than existing imitation learning methods given only a single demonstration. Furthermore, we demonstrate its success in tackling complex environments where standard approaches fall short. More information is available at: https://waypoint-ex.github.io.
arxiv情報
著者 | Mara Levy,Nirat Saini,Abhinav Shrivastava |
発行日 | 2024-07-22 17:59:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google