要約
このペーパーは、モデルベースの強化学習を使用して、マルチゴールの器用な手操作タスクを学習するという課題に取り組んでいます。
確率的なニューラルネットワークアンサンブルを設計して、高次元の器用な手ダイナミクスを説明し、非同期MPCポリシーを導入して、実際の器用なハンドシステムの制御周波数要件を満たすために、目標条件付き確率モデル予測制御(GC-PMPC)を提案します。
ランダムに生成された目標を持つ4つのシミュレートされたシャドウハンド操作シナリオに関する広範な評価は、最先端のベースラインよりもGC-PMPCの優れたパフォーマンスを示しています。
ケーブル駆動型の器用な手、12のアクティブなDOFと5つの触覚センサーを備えたDexhand 021を駆動し、相互作用の約80分以内に3つの目標ポーズに立方体を操作することを学び、費用対効果の高い器用なハンドプラットフォームで優れた学習効率と制御パフォーマンスを実証します。
要約(オリジナル)
This paper tackles the challenge of learning multi-goal dexterous hand manipulation tasks using model-based Reinforcement Learning. We propose Goal-Conditioned Probabilistic Model Predictive Control (GC-PMPC) by designing probabilistic neural network ensembles to describe the high-dimensional dexterous hand dynamics and introducing an asynchronous MPC policy to meet the control frequency requirements in real-world dexterous hand systems. Extensive evaluations on four simulated Shadow Hand manipulation scenarios with randomly generated goals demonstrate GC-PMPC’s superior performance over state-of-the-art baselines. It successfully drives a cable-driven Dexterous hand, DexHand 021 with 12 Active DOFs and 5 tactile sensors, to learn manipulating a cubic die to three goal poses within approximately 80 minutes of interactions, demonstrating exceptional learning efficiency and control performance on a cost-effective dexterous hand platform.
arxiv情報
著者 | Yingzhuo Jiang,Wenjun Huang,Rongdun Lin,Chenyang Miao,Tianfu Sun,Yunduan Cui |
発行日 | 2025-04-30 12:44:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google