Vector Field-Guided Learning Predictive Control for Motion Planning of Mobile Robots with Unknown Dynamics

要約

安全な操縦能力は、複雑な環境における移動ロボットにとって非常に重要です。
ただし、ロボット システムのダイナミクスは、動作計画や制御のプロセスにおいて、時間とともに変化し、不確実で、さらには未知であることがよくあります。
したがって、既存のモデルベースの強化学習 (RL) 手法の多くは、安全性の保証において満足な信頼性を達成できませんでした。
この課題に対処するために、安全な操縦性を保証する 2 レベルのベクトル場誘導学習予測制御 (VF-LPC) アプローチを提案します。
最初のレベルであるガイド レベルは、設計された運動力学的ガイド ベクトル場を使用して安全な望ましい軌道を生成し、障害物が密集した環境での安全な動作を可能にします。
2 番目のレベルである統合モーション計画制御 (IMPC) レベルでは、まずディープ Koopman オペレーターを使用してオフラインで公称動力学モデルを学習し、次にスパース ガウス過程 (GP) を使用してモデルの不確実性をオンラインで更新します。
次に、学習されたダイナミクスとゲームベースの安全バリア関数が学習予測制御フレームワークに組み込まれ、最適に近い制御シーケンスが生成されます。
私たちは、障害物が密集した環境で VF-LPC のパフォーマンスを既存の高度な計画手法と比較するテストを実施しました。
シミュレーション結果は、実現可能な軌道を迅速に生成できることを示しています。
次に、VF-LPC は、モデル予測制御 (MPC) と高忠実度 CarSim ソフトウェアの RL を使用する動作計画手法に対して評価されます。
結果は、VF-LPC が完了時間、ルートの長さ、平均解決時間の基準でそれらを上回っていることを示しています。
また、モデルの不確かさの学習能力を検証するために、レーシングロードでの経路追跡制御テストも実施しました。
最後に、Hongqi E-HS3 車両で実際の実験を実施し、VF-LPC アプローチの有効性をさらに検証しました。

要約(オリジナル)

Safe maneuvering capability is critical for mobile robots in complex environments. However, robotic system dynamics are often time-varying, uncertain, or even unknown during the motion planning and control process. Therefore, many existing model-based reinforcement learning (RL) methods could not achieve satisfactory reliability in guaranteeing safety. To address this challenge, we propose a two-level Vector Field-guided Learning Predictive Control (VF-LPC) approach that guarantees safe maneuverability. The first level, the guiding level, generates safe desired trajectories using the designed kinodynamic guiding vector field, enabling safe motion in obstacle-dense environments. The second level, the Integrated Motion Planning and Control (IMPC) level, first uses the deep Koopman operator to learn a nominal dynamics model offline and then updates the model uncertainties online using sparse Gaussian processes (GPs). The learned dynamics and game-based safe barrier function are then incorporated into the learning predictive control framework to generate near-optimal control sequences. We conducted tests to compare the performance of VF-LPC with existing advanced planning methods in an obstacle-dense environment. The simulation results show that it can generate feasible trajectories quickly. Then, VF-LPC is evaluated against motion planning methods that employ model predictive control (MPC) and RL in high-fidelity CarSim software. The results show that VF-LPC outperforms them under metrics of completion time, route length, and average solution time. We also carried out path-tracking control tests on a racing road to validate the model uncertainties learning capability. Finally, we conducted real-world experiments on a Hongqi E-HS3 vehicle, further validating the VF-LPC approach’s effectiveness.

arxiv情報

著者 Yang Lu,Weijia Yao,Yongqian Xiao,Xin Xu
発行日 2024-05-14 02:46:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク