DiffTune: Auto-Tuning through Auto-Differentiation


このペーパーでは、新しい勾配ベースの自動チューニング フレームワークである DiffTune を紹介します。
さらに、$\mathcal{L}_1$ 適応制御を使用して、モデル化されていない不確実性によって勾配が偏らないように、(物理システムに不可避的に存在する) 不確実性を補償します。
困難なシミュレーション環境で Dubin の車とクワッドローターで DiffTune を検証します。
最先端の自動チューニング方法と比較して、DiffTune はシステムの一次情報を効果的に使用するため、より効率的な方法で最高のパフォーマンスを実現します。
クアローター用の非線形コントローラーの調整に関する実験では、DiffTune が 12 次元のコントローラー パラメーター空間でわずか 10 回の試行で、アグレッシブな軌道で 3.5 倍のトラッキング エラー削減を達成するという有望な結果が示されました。


The performance of robots in high-level tasks depends on the quality of their lower-level controller, which requires fine-tuning. However, the intrinsically nonlinear dynamics and controllers make tuning a challenging task when it is done by hand. In this paper, we present DiffTune, a novel, gradient-based automatic tuning framework. We formulate the controller tuning as a parameter optimization problem. Our method unrolls the dynamical system and controller as a computational graph and updates the controller parameters through gradient-based optimization. The gradient is obtained using sensitivity propagation, which is the only method for gradient computation when tuning for a physical system instead of its simulated counterpart. Furthermore, we use $\mathcal{L}_1$ adaptive control to compensate for the uncertainties (that unavoidably exist in a physical system) such that the gradient is not biased by the unmodelled uncertainties. We validate the DiffTune on a Dubin’s car and a quadrotor in challenging simulation environments. In comparison with state-of-the-art auto-tuning methods, DiffTune achieves the best performance in a more efficient manner owing to its effective usage of the first-order information of the system. Experiments on tuning a nonlinear controller for quadrotor show promising results, where DiffTune achieves 3.5x tracking error reduction on an aggressive trajectory in only 10 trials over a 12-dimensional controller parameter space.


著者 Sheng Cheng,Minkyung Kim,Lin Song,Chengyu Yang,Yiquan Jin,Shenlong Wang,Naira Hovakimyan
発行日 2023-08-16 01:55:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク