要約
この論文では、タスクを追跡するためのモデルベース コントローラー (MBC) の (ほぼ) 最適な制御パラメーターをオンラインで決定するための学習ベースのアプローチである、タスク パラメーター ネクサス (TPN) について説明します。
TPN では、特に新しいタスクの最適なパラメーターがすぐに利用できない場合に、実行時に特定の追跡タスクの制御パラメーターを予測するためにディープ ニューラル ネットワークが導入されています。
このネットワークをトレーニングするために、さまざまな運動特性を表すさまざまな速度と曲率を備えた軌道バンクを構築しました。
次に、バンク内の各軌道に対して、最適な制御パラメーターをオフラインで自動調整し、それらを対応するグラウンド トゥルースとして使用します。
このデータセットを使用して、TPN は教師あり学習によってトレーニングされます。
クアッドローター プラットフォームで TPN を評価しました。
シミュレーション実験では、TPN がさまざまな追跡タスクに対して最適に近い制御パラメーターを予測できることが示され、目に見えないタスクに対する堅牢な一般化機能が実証されました。
要約(オリジナル)
This paper presents the Task-Parameter Nexus (TPN), a learning-based approach for online determination of the (near-)optimal control parameters of model-based controllers (MBCs) for tracking tasks. In TPN, a deep neural network is introduced to predict the control parameters for any given tracking task at runtime, especially when optimal parameters for new tasks are not immediately available. To train this network, we constructed a trajectory bank with various speeds and curvatures that represent different motion characteristics. Then, for each trajectory in the bank, we auto-tune the optimal control parameters offline and use them as the corresponding ground truth. With this dataset, the TPN is trained by supervised learning. We evaluated the TPN on the quadrotor platform. In simulation experiments, it is shown that the TPN can predict near-optimal control parameters for a spectrum of tracking tasks, demonstrating its robust generalization capabilities to unseen tasks.
arxiv情報
著者 | Sheng Cheng,Ran Tao,Yuliang Gu,Shenlong Wang,Xiaofeng Wang,Naira Hovakimyan |
発行日 | 2024-12-17 01:24:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google