要約
ロボットの安全な動作には正確な外乱推定が不可欠です。
最近提案されたニューラル移動地平線推定 (NeuroMHE) は、ポータブル ニューラル ネットワークを使用して MHE の重み付けをモデル化するもので、この点で有望です。
現在、NeuroMHE は勾配降下法を通じてトレーニングされており、その勾配はカルマン フィルターを使用して再帰的に計算されます。
本稿では、NeuroMHE を訓練するための信頼領域ポリシー最適化手法を提案します。
これは、MHE ヘシアンと呼ばれる MHE の 2 次導関数を提供することで実現します。
注目すべきことに、勾配を取得するためにすでに使用されている計算の多く、特にカルマン フィルターが、MHE ヘッセ行列を計算するために効率的に再利用できることが証明されています。
これにより、MHE ホライズンに対して線形の計算複雑さが実現されます。
オープンソースの実際のクアッドローター飛行データセットを使用した検証を通じて、私たちのアプローチはデータ効率の高いトレーニング (5 分未満) を実証し、力推定精度において最先端のニューラル推定器を最大 68.1% 上回ります (使用率はわずか 1.4%)。
ネットワークパラメータの。
さらに、私たちの方法は、勾配降下法に比べてネットワークの初期化に対する堅牢性が強化されていることを示しています。
要約(オリジナル)
Accurate disturbance estimation is essential for safe robot operations. The recently proposed neural moving horizon estimation (NeuroMHE), which uses a portable neural network to model the MHE’s weightings, shows promise in this context. Currently, NeuroMHE is trained through gradient descent, with its gradient computed recursively using a Kalman filter. This paper proposes a trust-region policy optimization method for training NeuroMHE. We achieve this by providing the second-order derivatives of MHE, referred to as the MHE Hessian. Remarkably, we establish that much of computation already used to obtain the gradient, especially the Kalman filter, can be efficiently reused to compute the MHE Hessian. This offers linear computational complexity relative to the MHE horizon. Through validation with an open-source real quadrotor flight dataset, our approach demonstrates data-efficient training (<5 min) and outperforms a state-of-the-art neural estimator by up to 68.1% in force estimation accuracy, utilizing only 1.4% of its network parameters. Furthermore, our method showcases enhanced robustness to network initialization compared to the gradient descent counterpart.
arxiv情報
著者 | Bingheng Wang,Xuyang Chen,Lin Zhao |
発行日 | 2023-09-12 04:34:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google