DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References

要約

人間の参照からの器用な操作のための一般化可能なニューラル追跡コントローラーを開発するという課題に対処します。
このコントローラーは、車のロボットハンドを管理して、運動学的人間とオブジェクトの相互作用によって定義されるさまざまな目的のために、多様なオブジェクトを操作することを目的としています。
このようなコントローラーの開発は、器用な操作の複雑な接触ダイナミクスと、適応性、一般化可能性、堅牢性の必要性によって複雑になります。
現在の補強学習と軌跡の最適化方法は、タスク固有の報酬または正確なシステムモデルに依存しているため、しばしば不足しています。
ニューラルコントローラーを訓練するために、人間の参照とロボットアクションのペアを含む大規模な成功したロボット追跡デモンストレーションをキュレートするアプローチを紹介します。
データフライホイールを利用して、コントローラーのパフォーマンスと、成功した追跡デモンストレーションの数と品質を繰り返し向上させます。
利用可能な追跡デモンストレーションを活用し、動的環境でのコントローラーのパフォーマンスを高めるために、強化学習と模倣学習を慎重に統合します。
同時に、高品質の追跡デモンストレーションを取得するために、ホモトピー最適化方法で学習された追跡コントローラーを活用することにより、トラコリジェクトごとの追跡を個別に最適化します。
ホモトピーの最適化、考え方を模倣し、挑戦的な軌跡追跡の問題を解決してデモンストレーションの多様性を高めるのに役立ちます。
一般化可能なニューラルコントローラーをトレーニングし、シミュレーションと現実世界の両方で評価することで、成功を紹介します。
私たちの方法は、主要なベースラインと比較して、成功率の10%以上の改善を達成しています。
アニメーション化された結果を備えたプロジェクトWebサイトは、https://meowuu7.github.io/dextrack/で入手できます。

要約(オリジナル)

We address the challenge of developing a generalizable neural tracking controller for dexterous manipulation from human references. This controller aims to manage a dexterous robot hand to manipulate diverse objects for various purposes defined by kinematic human-object interactions. Developing such a controller is complicated by the intricate contact dynamics of dexterous manipulation and the need for adaptivity, generalizability, and robustness. Current reinforcement learning and trajectory optimization methods often fall short due to their dependence on task-specific rewards or precise system models. We introduce an approach that curates large-scale successful robot tracking demonstrations, comprising pairs of human references and robot actions, to train a neural controller. Utilizing a data flywheel, we iteratively enhance the controller’s performance, as well as the number and quality of successful tracking demonstrations. We exploit available tracking demonstrations and carefully integrate reinforcement learning and imitation learning to boost the controller’s performance in dynamic environments. At the same time, to obtain high-quality tracking demonstrations, we individually optimize per-trajectory tracking by leveraging the learned tracking controller in a homotopy optimization method. The homotopy optimization, mimicking chain-of-thought, aids in solving challenging trajectory tracking problems to increase demonstration diversity. We showcase our success by training a generalizable neural controller and evaluating it in both simulation and real world. Our method achieves over a 10% improvement in success rates compared to leading baselines. The project website with animated results is available at https://meowuu7.github.io/DexTrack/.

arxiv情報

著者 Xueyi Liu,Jianibieke Adalibieke,Qianwei Han,Yuzhe Qin,Li Yi
発行日 2025-02-13 18:59:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク