Complementarity-Free Multi-Contact Modeling and Optimization for Dexterous Manipulation

要約

モデルベースの手法が器用な操作における強化学習の高いパフォーマンスに匹敵することを妨げる重大な障壁は、マルチ接触ダイナミクスに固有の複雑さです。
従来、相補性モデルを使用して定式化されてきたマルチ接触ダイナミクスは、組み合わせの複雑さと非滑らかさをもたらし、接触が豊富な計画と制御を複雑にします。
この論文では、新しい単純化された複数接触モデルを導入することで、これらの課題を回避します。
最適化ベースの接触モデルの二重性から派生した新しいモデルは、相補性構成を完全に省略し、明示的な時間ステップ、微分可能性、クーロン摩擦則の自動的な充足、最小限のハイパーパラメーター調整などの計算上の利点を提供します。
私たちは、指先 3D 空中操作、TriFinger による手の操作、Allegro の手と手のひらの向きの変更など、さまざまなオブジェクトを使用した、さまざまな難しい器用な操作タスクの計画と制御におけるモデルの有効性と効率を実証します。
私たちの方法は、一貫して最先端の結果を達成しています。(I) タスク全体で 96.5% の平均成功率、(II) 平均再配向誤差 11{\deg} および位置誤差 7.8 mm の高い操作精度、および
(III) テストされたすべての器用な操作タスクに対して 50 ~ 100 Hz で実行されるモデル予測制御。
これらの結果は、最小限のハイパーパラメータ調整で達成されます。

要約(オリジナル)

A significant barrier preventing model-based methods from matching the high performance of reinforcement learning in dexterous manipulation is the inherent complexity of multi-contact dynamics. Traditionally formulated using complementarity models, multi-contact dynamics introduces combinatorial complexity and non-smoothness, complicating contact-rich planning and control. In this paper, we circumvent these challenges by introducing a novel, simplified multi-contact model. Our new model, derived from the duality of optimization-based contact models, dispenses with the complementarity constructs entirely, providing computational advantages such as explicit time stepping, differentiability, automatic satisfaction of Coulomb friction law, and minimal hyperparameter tuning. We demonstrate the effectiveness and efficiency of the model for planning and control in a range of challenging dexterous manipulation tasks, including fingertip 3D in-air manipulation, TriFinger in-hand manipulation, and Allegro hand on-palm reorientation, all with diverse objects. Our method consistently achieves state-of-the-art results: (I) a 96.5% average success rate across tasks, (II) high manipulation accuracy with an average reorientation error of 11{\deg} and position error of 7.8 mm, and (III) model predictive control running at 50-100 Hz for all tested dexterous manipulation tasks. These results are achieved with minimal hyperparameter tuning.

arxiv情報

著者 Wanxin Jin
発行日 2024-08-18 02:52:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク