要約
ロボット工学では模倣学習アルゴリズムが広く普及していますが、ハイパーパラメーターの感度、トレーニングの容易さ、データ効率、パフォーマンスに関するその特性は、業界からインスピレーションを得た高精度の環境では十分に研究されていません。
この研究では、著名な模倣学習アプローチの限界と利点を実証し、これらの特性に関するその能力を分析します。
操作対象と環境の間の複数の接触を伴う設定で、過剰に拘束されたダイナミクス システムを含む複雑な両手操作タスクで各アルゴリズムを評価します。
模倣学習はこのような複雑なタスクを解決するのに適していることがわかりましたが、環境およびハイパーパラメータの摂動の処理、トレーニング要件、パフォーマンス、使いやすさの点で、すべてのアルゴリズムが同等であるわけではありません。
私たちは、慎重に設計された実験手順と学習環境を使用して、これらの主要な特性の経験的影響を調査します。
紙のウェブサイト: https://bimanual-imitation.github.io/
要約(オリジナル)
Amidst the wide popularity of imitation learning algorithms in robotics, their properties regarding hyperparameter sensitivity, ease of training, data efficiency, and performance have not been well-studied in high-precision industry-inspired environments. In this work, we demonstrate the limitations and benefits of prominent imitation learning approaches and analyze their capabilities regarding these properties. We evaluate each algorithm on a complex bimanual manipulation task involving an over-constrained dynamics system in a setting involving multiple contacts between the manipulated object and the environment. While we find that imitation learning is well suited to solve such complex tasks, not all algorithms are equal in terms of handling environmental and hyperparameter perturbations, training requirements, performance, and ease of use. We investigate the empirical influence of these key characteristics by employing a carefully designed experimental procedure and learning environment. Paper website: https://bimanual-imitation.github.io/
arxiv情報
著者 | Michael Drolet,Simon Stepputtis,Siva Kailas,Ajinkya Jain,Jan Peters,Stefan Schaal,Heni Ben Amor |
発行日 | 2024-08-13 00:04:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google