Task-Parameter Nexus: Task-Specific Parameter Learning for Model-Based Control

要約

このペーパーでは、タスクを追跡するためのモデルベースのコントローラー(MBC)の(近く)最適な制御パラメーターのオンライン決定のための学習ベースのアプローチであるタスクパラメーターNexus(TPN)を紹介します。
TPNでは、特に新しいタスクの最適なパラメーターがすぐに利用できない場合、実行時に特定の追跡タスクの制御パラメーターを予測するために、深いニューラルネットワークが導入されています。
このネットワークをトレーニングするために、さまざまなモーション特性を表すさまざまな速度と曲率を持つ軌跡銀行を建設しました。
次に、銀行の各軌道について、オフラインで最適な制御パラメーターを自動調整し、それらを対応するグラウンドトゥルースとして使用します。
このデータセットを使用すると、TPNは監視された学習によってトレーニングされます。
QuadrotorプラットフォームでTPNを評価しました。
シミュレーション実験では、TPNが一連の追跡タスクの最適に近い制御パラメーターを予測し、目に見えないタスクに対する堅牢な一般化機能を実証できることが示されています。

要約(オリジナル)

This paper presents the Task-Parameter Nexus (TPN), a learning-based approach for online determination of the (near-)optimal control parameters of model-based controllers (MBCs) for tracking tasks. In TPN, a deep neural network is introduced to predict the control parameters for any given tracking task at runtime, especially when optimal parameters for new tasks are not immediately available. To train this network, we constructed a trajectory bank with various speeds and curvatures that represent different motion characteristics. Then, for each trajectory in the bank, we auto-tune the optimal control parameters offline and use them as the corresponding ground truth. With this dataset, the TPN is trained by supervised learning. We evaluated the TPN on the quadrotor platform. In simulation experiments, it is shown that the TPN can predict near-optimal control parameters for a spectrum of tracking tasks, demonstrating its robust generalization capabilities to unseen tasks.

arxiv情報

著者 Sheng Cheng,Ran Tao,Yuliang Gu,Shenlong Wang,Xiaofeng Wang,Naira Hovakimyan
発行日 2025-04-09 16:54:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク