DiffTune: Auto-Tuning through Auto-Differentiation

要約

高レベルのタスクにおけるロボットのパフォーマンスは、下位レベルのコントローラーの品質に依存するため、微調整が必​​要です。
ただし、本質的に非線形のダイナミクスとコントローラーにより、手作業でチューニングを行うのは困難な作業になります。
このペーパーでは、新しい勾配ベースの自動チューニング フレームワークである DiffTune を紹介します。
コントローラーの調整をパラメーター最適化問題として定式化します。
私たちの方法では、動的システムとコントローラーを計算グラフとして展開し、勾配ベースの最適化を通じてコン​​トローラーのパラメーターを更新します。
勾配は感度伝播を使用して取得されます。これは、シミュレートされた対応するシステムではなく物理システムに合わせて調整する場合の勾配計算の唯一の方法です。
さらに、$\mathcal{L}_1$ 適応制御を使用して、モデル化されていない不確実性によって勾配が偏らないように、(物理システムに不可避的に存在する) 不確実性を補償します。
困難なシミュレーション環境で Dubin の車とクワッドローターで DiffTune を検証します。
最先端の自動チューニング方法と比較して、DiffTune はシステムの一次情報を効果的に使用するため、より効率的な方法で最高のパフォーマンスを実現します。
クアローター用の非線形コントローラーの調整に関する実験では、DiffTune が 12 次元のコントローラー パラメーター空間でわずか 10 回の試行で、アグレッシブな軌道で 3.5 倍のトラッキング エラー削減を達成するという有望な結果が示されました。

要約(オリジナル)

The performance of robots in high-level tasks depends on the quality of their lower-level controller, which requires fine-tuning. However, the intrinsically nonlinear dynamics and controllers make tuning a challenging task when it is done by hand. In this paper, we present DiffTune, a novel, gradient-based automatic tuning framework. We formulate the controller tuning as a parameter optimization problem. Our method unrolls the dynamical system and controller as a computational graph and updates the controller parameters through gradient-based optimization. The gradient is obtained using sensitivity propagation, which is the only method for gradient computation when tuning for a physical system instead of its simulated counterpart. Furthermore, we use $\mathcal{L}_1$ adaptive control to compensate for the uncertainties (that unavoidably exist in a physical system) such that the gradient is not biased by the unmodelled uncertainties. We validate the DiffTune on a Dubin’s car and a quadrotor in challenging simulation environments. In comparison with state-of-the-art auto-tuning methods, DiffTune achieves the best performance in a more efficient manner owing to its effective usage of the first-order information of the system. Experiments on tuning a nonlinear controller for quadrotor show promising results, where DiffTune achieves 3.5x tracking error reduction on an aggressive trajectory in only 10 trials over a 12-dimensional controller parameter space.

arxiv情報

著者 Sheng Cheng,Minkyung Kim,Lin Song,Chengyu Yang,Yiquan Jin,Shenlong Wang,Naira Hovakimyan
発行日 2024-07-11 01:57:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク