要約
学習ベースのアプローチによって可能になった印象的な巧みな操作能力にもかかわらず、十分なリソースを備えた研究室以外での広範な採用はまだ目撃されていません。
これはおそらく、多大な計算負荷、不可解な学習動作、初期化に対する敏感さ、実装に必要なかなりの技術的専門知識などの実際的な制限によるものと考えられます。
この研究では、これらの制限を軽減する際のコープマン演算子理論の有用性を調査します。
コープマン演算子は、複雑な非線形ダイナミクスを高次元の線形システムとして表現するための、シンプルかつ強力な制御理論構造です。
複雑な非線形力学が器用な操作の根底にあるという事実に動機付けられ、ロボットハンドと物体の両方の望ましい動きを同時に学習するための、クープマンオペレーターベースの模倣学習フレームワークを開発しました。
私たちは、コープマン オペレーターが器用な操作に驚くほど効果的であり、多くのユニークな利点を提供することを示します。
特に、ポリシーは分析的に学習できるため、計算の負担が大幅に軽減され、初期化に対する敏感性や骨の折れるハイパーパラメータの最適化の必要性が排除されます。
私たちの実験により、コープマン オペレーター ベースのアプローチは、成功率とサンプル効率の点で最先端の模倣学習アルゴリズムと同等のパフォーマンスを発揮できると同時に、桁違いに高速であることが明らかになりました。
ポリシーのビデオは https://sites.google.com/view/kodex-corl でご覧いただけます。
要約(オリジナル)
Despite impressive dexterous manipulation capabilities enabled by learning-based approaches, we are yet to witness widespread adoption beyond well-resourced laboratories. This is likely due to practical limitations, such as significant computational burden, inscrutable learned behaviors, sensitivity to initialization, and the considerable technical expertise required for implementation. In this work, we investigate the utility of Koopman operator theory in alleviating these limitations. Koopman operators are simple yet powerful control-theoretic structures to represent complex nonlinear dynamics as linear systems in higher dimensions. Motivated by the fact that complex nonlinear dynamics underlie dexterous manipulation, we develop a Koopman operator-based imitation learning framework to learn the desired motions of both the robotic hand and the object simultaneously. We show that Koopman operators are surprisingly effective for dexterous manipulation and offer a number of unique benefits. Notably, policies can be learned analytically, drastically reducing computation burden and eliminating sensitivity to initialization and the need for painstaking hyperparameter optimization. Our experiments reveal that a Koopman operator-based approach can perform comparably to state-of-the-art imitation learning algorithms in terms of success rate and sample efficiency, while being an order of magnitude faster. Policy videos can be viewed at https://sites.google.com/view/kodex-corl.
arxiv情報
著者 | Yunhai Han,Mandy Xie,Ye Zhao,Harish Ravichandar |
発行日 | 2023-08-31 01:44:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google