Predictive Linear Online Tracking for Unknown Targets

要約

この論文では、移動ターゲットを追跡することを目的とした線形制御システムにおけるオンライン追跡の問題を研究します。
古典的な追跡制御とは異なり、ターゲットは未知で非定常であり、その状態は逐次的に明らかにされるため、オンライン非確率制御のフレームワークに適合します。
私たちは二次コストの場合を考慮し、予測線形オンライン追跡 (PLOT) と呼ばれる新しいアルゴリズムを提案します。
このアルゴリズムは、指数関数的忘却を伴う再帰的最小二乗法を使用して、ターゲットの時変動的モデルを学習します。
学習されたモデルは、後退水平線制御の枠組みの下で最適な政策に使用されます。
PLOT スケールの動的なリグレスを $\mathcal{O}(\sqrt{TV_T})$ で示します。ここで、$V_T$ はターゲット ダイナミクスの合計変動、$T$ は時間軸です。
以前の研究とは異なり、我々の理論的結果は非静止ターゲットにも当てはまります。
私たちは実際のクワッドローターに PLOT を実装し、オープンソース ソフトウェアを提供することで、実際のハードウェア上でのオンライン制御手法の最初の成功したアプリケーションの 1 つを紹介します。

要約(オリジナル)

In this paper, we study the problem of online tracking in linear control systems, where the objective is to follow a moving target. Unlike classical tracking control, the target is unknown, non-stationary, and its state is revealed sequentially, thus, fitting the framework of online non-stochastic control. We consider the case of quadratic costs and propose a new algorithm, called predictive linear online tracking (PLOT). The algorithm uses recursive least squares with exponential forgetting to learn a time-varying dynamic model of the target. The learned model is used in the optimal policy under the framework of receding horizon control. We show the dynamic regret of PLOT scales with $\mathcal{O}(\sqrt{TV_T})$, where $V_T$ is the total variation of the target dynamics and $T$ is the time horizon. Unlike prior work, our theoretical results hold for non-stationary targets. We implement PLOT on a real quadrotor and provide open-source software, thus, showcasing one of the first successful applications of online control methods on real hardware.

arxiv情報

著者 Anastasios Tsiamis,Aren Karapetyan,Yueshan Li,Efe C. Balta,John Lygeros
発行日 2024-06-13 13:04:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC パーマリンク