DexterityGen: Foundation Controller for Unprecedented Dexterity

要約

ロボットを教えるツールの使用などの器用な操作スキルは、重要な課題を提示します。
現在のアプローチは、人間の遠隔操作(模倣学習のため)とSIM-to-Real強化学習の2つの戦略に広く分類できます。
最初のアプローチは、人間がタッチフィードバックなしで異なる具体化に安全で器用な動きを生成することが難しいため、困難です。
2番目のRLベースのアプローチは、ドメインギャップと闘い、複雑なタスクで非常にタスク固有の報酬エンジニアリングを伴います。
私たちの重要な洞察は、RLが低レベルのモーションプリミティブを学習するのに効果的であり、人間は複雑で長老のタスクに粗いモーションコマンドを提供することに優れていることです。
したがって、最適なソリューションは、両方のアプローチの組み合わせである可能性があります。
このホワイトペーパーでは、RLを使用して、手の回転や翻訳などの大規模な器用なモーションプリミティブを取得するDexterityGen(Dexgen)を紹介します。
次に、この学んだデータセットを活用して、器用な基礎コントローラーをトレーニングします。
現実の世界では、人間のテレオ操作をコントローラーへのプロンプトとして使用して、非常に器用な動作を生成します。
シミュレーションと現実世界の両方におけるdexgenの有効性を評価し、入力の器用な操作コマンドを実現し、多様なタスク全体のオブジェクトを保持する期間として10〜100倍安定性を大幅に改善できる汎用コントローラーであることを示しています。
特に、Dexgenを使用すると、ペン、注射器、ドライバーなどの多様なオブジェクトの再配向性や器用なツールの使用など、前例のない器用なスキルを初めて示します。

要約(オリジナル)

Teaching robots dexterous manipulation skills, such as tool use, presents a significant challenge. Current approaches can be broadly categorized into two strategies: human teleoperation (for imitation learning) and sim-to-real reinforcement learning. The first approach is difficult as it is hard for humans to produce safe and dexterous motions on a different embodiment without touch feedback. The second RL-based approach struggles with the domain gap and involves highly task-specific reward engineering on complex tasks. Our key insight is that RL is effective at learning low-level motion primitives, while humans excel at providing coarse motion commands for complex, long-horizon tasks. Therefore, the optimal solution might be a combination of both approaches. In this paper, we introduce DexterityGen (DexGen), which uses RL to pretrain large-scale dexterous motion primitives, such as in-hand rotation or translation. We then leverage this learned dataset to train a dexterous foundational controller. In the real world, we use human teleoperation as a prompt to the controller to produce highly dexterous behavior. We evaluate the effectiveness of DexGen in both simulation and real world, demonstrating that it is a general-purpose controller that can realize input dexterous manipulation commands and significantly improves stability by 10-100x measured as duration of holding objects across diverse tasks. Notably, with DexGen we demonstrate unprecedented dexterous skills including diverse object reorientation and dexterous tool use such as pen, syringe, and screwdriver for the first time.

arxiv情報

著者 Zhao-Heng Yin,Changhao Wang,Luis Pineda,Francois Hogan,Krishna Bodduluri,Akash Sharma,Patrick Lancaster,Ishita Prasad,Mrinal Kalakrishnan,Jitendra Malik,Mike Lambeta,Tingfan Wu,Pieter Abbeel,Mustafa Mukadam
発行日 2025-02-06 18:49:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY パーマリンク