MyoDex: A Generalizable Prior for Dexterous Manipulation

要約

人間の器用さはモーター制御の特徴です。
私たちの手は、筋骨格系の感覚運動回路の複雑さ(23 個の関節が 40 以上の筋肉によって制御される多関節および多関節)にもかかわらず、新しい動作を迅速に合成することができます。
この作品では、人間の器用さが単一のタスクを通じて獲得されるのではなく、これまでのさまざまな経験に基づいて構築される方法からインスピレーションを得ています。
この観察に動機付けられて、私たちは以前の経験に基づいて新しい (以前は達成できなかった) 行動を迅速に習得できるエージェントの開発に着手しました。
具体的には、私たちのアプローチはマルチタスク学習を活用して、生理学的に現実的な人間の手モデルである MyoHand を使用して、人間のような器用さのためのタスク非依存行動事前分布 (MyoDex) を暗黙的に取得します。
私たちは、数ショットの一般化と、目に見えない器用な操作タスクの大きなレパートリーへの積極的な移行における MyoDex の有効性を実証します。
MyoDex を活用するエージェントは、蒸留ベースラインと比較して、約 3 倍多くのタスクを解決し、4 倍の速度で解決できます。
これまでの研究では単一の筋骨格制御行動が合成されてきましたが、MyoDex は、多種多様な接触の多い行動にわたる器用な生理学的制御の学習を触媒する、これまでにない一般化可能な操作です。
また、24 DoF Adroit Hand の器用さの獲得に向けて、筋骨格制御を超えたパラダイムの有効性も実証します。
ウェブサイト: https://sites.google.com/view/myodex

要約(オリジナル)

Human dexterity is a hallmark of motor control. Our hands can rapidly synthesize new behaviors despite the complexity (multi-articular and multi-joints, with 23 joints controlled by more than 40 muscles) of musculoskeletal sensory-motor circuits. In this work, we take inspiration from how human dexterity builds on a diversity of prior experiences, instead of being acquired through a single task. Motivated by this observation, we set out to develop agents that can build upon their previous experience to quickly acquire new (previously unattainable) behaviors. Specifically, our approach leverages multi-task learning to implicitly capture task-agnostic behavioral priors (MyoDex) for human-like dexterity, using a physiologically realistic human hand model – MyoHand. We demonstrate MyoDex’s effectiveness in few-shot generalization as well as positive transfer to a large repertoire of unseen dexterous manipulation tasks. Agents leveraging MyoDex can solve approximately 3x more tasks, and 4x faster in comparison to a distillation baseline. While prior work has synthesized single musculoskeletal control behaviors, MyoDex is the first generalizable manipulation prior that catalyzes the learning of dexterous physiological control across a large variety of contact-rich behaviors. We also demonstrate the effectiveness of our paradigms beyond musculoskeletal control towards the acquisition of dexterity in 24 DoF Adroit Hand. Website: https://sites.google.com/view/myodex

arxiv情報

著者 Vittorio Caggiano,Sudeep Dasari,Vikash Kumar
発行日 2023-09-06 16:10:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク