Context-Aware Deep Lagrangian Networks for Model Predictive Control

要約

深いラグランジアンネットワーク(Delan)などの物理情報に基づいた動的モデルに基づいてロボットを制御することで、結果として生じる動作の一般化と解釈可能性を改善できます。
ただし、複雑な環境では、潜在的に相互作用するオブジェクトの数は膨大であり、それらの物理的特性はしばしば不確実です。
この複雑さにより、単一のグローバルモデルを採用することは実行不可能です。
したがって、環境の現在関連する側面のみをキャプチャするコンテキスト認識モデルのオンラインシステム識別に頼る必要があります。
エネルギーの保存などの物理的原理は、さまざまなコンテキスト全体に保持されない場合がありますが、特にモデル予測制御(MPC)などの地平線制御方法を後退させるためにそれを使用する場合、個々のコンテキストを意識するモデルの物理的妥当性を確保することは非常に望ましい場合があります。
したがって、この作業では、デランを拡張してコンテキストを認識させ、オンラインシステム識別のための再発ネットワークと組み合わせて、適応性のある物理学に基づいた制御のためにMPCと統合します。
また、デランと残留ダイナミクスモデルを組み合わせて、ロボットの名目モデルが通常利用可能であるという事実を活用します。
さまざまな負荷の下で軌跡追跡のために、7-DOFロボットアームでの方法を評価します。
私たちの方法は、拡張されたカルマンフィルターを使用するベースラインによって達成された21%の改善と比較して、エンドエフェクター追跡エラーを39%減少させます。

要約(オリジナル)

Controlling a robot based on physics-informed dynamic models, such as deep Lagrangian networks (DeLaN), can improve the generalizability and interpretability of the resulting behavior. However, in complex environments, the number of objects to potentially interact with is vast, and their physical properties are often uncertain. This complexity makes it infeasible to employ a single global model. Therefore, we need to resort to online system identification of context-aware models that capture only the currently relevant aspects of the environment. While physical principles such as the conservation of energy may not hold across varying contexts, ensuring physical plausibility for any individual context-aware model can still be highly desirable, particularly when using it for receding horizon control methods such as Model Predictive Control (MPC). Hence, in this work, we extend DeLaN to make it context-aware, combine it with a recurrent network for online system identification, and integrate it with a MPC for adaptive, physics-informed control. We also combine DeLaN with a residual dynamics model to leverage the fact that a nominal model of the robot is typically available. We evaluate our method on a 7-DOF robot arm for trajectory tracking under varying loads. Our method reduces the end-effector tracking error by 39%, compared to a 21% improvement achieved by a baseline that uses an extended Kalman filter.

arxiv情報

著者 Lucas Schulze,Jan Peters,Oleg Arenz
発行日 2025-06-18 08:26:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク