要約
非線形ダイナミクスのモデリングと制御は、特に予測不可能な外部の影響と複雑なダイナミクスを備えたシナリオでは、ロボット工学で重要です。
従来のカスケードされたモジュラー制御パイプラインは、保守的な仮定と退屈なパラメーターのチューニングにより、しばしば最適ではないパフォーマンスをもたらすことがよくあります。
純粋なデータ駆動型アプローチは、堅牢なパフォーマンスを約束しますが、サンプル効率の低さ、SIMからリアルのギャップ、および広範なデータセットへの依存に苦しんでいます。
学習ベースと従来のモデルベースの制御をエンドツーエンドの方法で組み合わせたハイブリッド方法は、有望な選択肢を提供します。
この作業は、無人航空機(UAV)姿勢制御のための学習ベースの慣性臭気測定(IO)モジュールと微分可能なモデル予測制御(D-MPC)を組み合わせた自己科学の学習フレームワークを提示します。
IOは、生のIMU測定値を形成し、UAVの態度を予測します。これは、内側のMPCが制御アクションを最適化し、現実世界と予測されるパフォーマンスの間の矛盾を最小限に抑えるBIレベル最適化(BLO)セットアップの制御アクションのためにMPCによって最適化されます。
したがって、フレームワークはエンドツーエンドであり、自己監視された方法でトレーニングすることができます。
このアプローチは、学習ベースの知覚の強さと解釈可能なモデルベースの制御を組み合わせています。
結果は、強風の下でも有効性を示しています。
MPCパラメーター学習とIMU予測パフォーマンスの両方を同時に強化できます。
要約(オリジナル)
Modeling and control of nonlinear dynamics are critical in robotics, especially in scenarios with unpredictable external influences and complex dynamics. Traditional cascaded modular control pipelines often yield suboptimal performance due to conservative assumptions and tedious parameter tuning. Pure data-driven approaches promise robust performance but suffer from low sample efficiency, sim-to-real gaps, and reliance on extensive datasets. Hybrid methods combining learning-based and traditional model-based control in an end-to-end manner offer a promising alternative. This work presents a self-supervised learning framework combining learning-based inertial odometry (IO) module and differentiable model predictive control (d-MPC) for Unmanned Aerial Vehicle (UAV) attitude control. The IO denoises raw IMU measurements and predicts UAV attitudes, which are then optimized by MPC for control actions in a bi-level optimization (BLO) setup, where the inner MPC optimizes control actions and the upper level minimizes discrepancy between real-world and predicted performance. The framework is thus end-to-end and can be trained in a self-supervised manner. This approach combines the strength of learning-based perception with the interpretable model-based control. Results show the effectiveness even under strong wind. It can simultaneously enhance both the MPC parameter learning and IMU prediction performance.
arxiv情報
著者 | Haonan He,Yuheng Qiu,Junyi Geng |
発行日 | 2025-04-17 16:55:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google