Hard Contacts with Soft Gradients: Refining Differentiable Simulators for Learning and Control

要約

コンタクトフォースは、システムの速度にジャンプを導入する際に、ロボットダイナミクスのグラデーションベースの最適化に大きな課題をもたらします。
Mujocoなどのペナルティベースのシミュレーターは、接触力を軟化させることにより勾配計算を簡素化します。
ただし、ハードコンタクトを現実的にシミュレートするには、非常に硬い接点設定が必要であり、自動分化を使用するときに誤った勾配につながります。
一方、非極度の設定を使用すると、SIMからリアルのギャップが大幅に増加します。
ペナルティベースのシミュレータの連絡先計算を分析して、勾配エラーの原因を特定します。
次に、適応型統合とMujoco XLAを組み合わせたDiffMJXを提案し、ハードコンタクトの存在下で勾配の品質を顕著に向上させます。
最後に、連絡先の勾配の重要な制限に対処します。オブジェクトが触れないと消えます。
これを克服するために、シミュレーターがオブジェクトが接触する前であっても有益な接触勾配を生成できるメカニズムである距離(CFD)からの連絡先を導入します。
物理的なリアリズムを維持するために、ストレートスルートリックを使用してBackward PassでのみCFDを適用し、フォワードシミュレーションを変更せずに有用なグラデーションを計算できるようにします。

要約(オリジナル)

Contact forces pose a major challenge for gradient-based optimization of robot dynamics as they introduce jumps in the system’s velocities. Penalty-based simulators, such as MuJoCo, simplify gradient computation by softening the contact forces. However, realistically simulating hard contacts requires very stiff contact settings, which leads to incorrect gradients when using automatic differentiation. On the other hand, using non-stiff settings strongly increases the sim-to-real gap. We analyze the contact computation of penalty-based simulators to identify the causes of gradient errors. Then, we propose DiffMJX, which combines adaptive integration with MuJoCo XLA, to notably improve gradient quality in the presence of hard contacts. Finally, we address a key limitation of contact gradients: they vanish when objects do not touch. To overcome this, we introduce Contacts From Distance (CFD), a mechanism that enables the simulator to generate informative contact gradients even before objects are in contact. To preserve physical realism, we apply CFD only in the backward pass using a straight-through trick, allowing us to compute useful gradients without modifying the forward simulation.

arxiv情報

著者 Anselm Paulus,A. René Geist,Pierre Schumacher,Vít Musil,Georg Martius
発行日 2025-06-17 04:58:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY, G.1.6 パーマリンク