要約
我々は、収集が面倒なデモンストレーションに頼ることなく、複数の指を持つ手の非対称両手スキルを効率的に学習できる新しい強化学習 (RL) フレームワークである AsymDex (非対称敏捷性) を紹介します。
2 つの重要な成分により、AsymDex は観察およびアクション空間の寸法を削減し、サンプル効率を向上させることができます。
まず、AsymDex は人間の両手操作に見られる自然な非対称性を利用し、それぞれの手に特定の相互依存する役割を割り当てます。つまり、物体を動かしたり向きを変える促進手と、その物体に対して複雑な操作を実行する利き手です。
第 2 に、AsymDex は相対的な観察空間とアクション空間を定義して操作し、両手間の応答性の高い調整を容易にします。
さらに、AsymDex は、両手の器用さの物体取得段階と相互作用段階の両方を処理する把握学習の最近の進歩と簡単に統合できます。
特定のタスクに合わせて調整された両手の器用さのための既存の RL ベースの方法とは異なり、AsymDex は非対称性を示す幅広い種類の両手タスクを学習するために使用できます。
シミュレートされた 4 つの非対称両手器用操作タスクに関する詳細な実験により、成功率とサンプル効率の点で、AsymDex が設計の選択に課題をもたらす強力なベースラインを常に上回っていることが明らかになりました。
プロジェクトの Web サイトは https://sites.google.com/view/asymdex-2024/ にあります。
要約(オリジナル)
We present Asymmetric Dexterity (AsymDex), a novel reinforcement learning (RL) framework that can efficiently learn asymmetric bimanual skills for multi-fingered hands without relying on demonstrations, which can be cumbersome to collect. Two crucial ingredients enable AsymDex to reduce the observation and action space dimensions and improve sample efficiency. First, AsymDex leverages the natural asymmetry found in human bimanual manipulation and assigns specific and interdependent roles to each hand: a facilitating hand that moves and reorients the object, and a dominant hand that performs complex manipulations on said object. Second, AsymDex defines and operates over relative observation and action spaces, facilitating responsive coordination between the two hands. Further, AsymDex can be easily integrated with recent advances in grasp learning to handle both the object acquisition phase and the interaction phase of bimanual dexterity. Unlike existing RL-based methods for bimanual dexterity, which are tailored to a specific task, AsymDex can be used to learn a wide variety of bimanual tasks that exhibit asymmetry. Detailed experiments on four simulated asymmetric bimanual dexterous manipulation tasks reveal that AsymDex consistently outperforms strong baselines that challenge its design choices, in terms of success rate and sample efficiency. The project website is at https://sites.google.com/view/asymdex-2024/.
arxiv情報
著者 | Zhaodong Yang,Yunhai Han,Harish Ravichandar |
発行日 | 2024-11-20 03:47:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google