Modelling, Positioning, and Deep Reinforcement Learning Path Tracking Control of Scaled Robotic Vehicles: Design and Experimental Validation

要約

モバイルロボットシステムの人気はますます高まっています。
これらのシステムは、倉庫保管や製造から、人工知能 (AI) ベースの制御ソリューションなどの高度な制御戦略を評価するためのテストベンチに至るまで、さまざまな屋内アプリケーションで使用されています。
スケール化されたロボット カーには、車両の状態推定と制御専用のタスクを含む階層的な制御機能が搭載されているのが一般的です。
この論文では、(i) フェデレーテッド拡張カルマン フィルター (FEKF)、(ii) 学習フェーズを促進し、シミュレーションに対するロバスト性を高めるために専門家のデモンストレーターを介して訓練された新しい深層強化学習 (DRL) パス トラッキング コントローラーを提案することで、両方の側面をカバーしています。
現実とのギャップ。
この論文では、パラメータを特定するための効果的かつ簡単な手順とともに、車両モデルの定式化についても説明します。
実験的に検証されたモデルは、(i) FEKF の設計をサポートし、(ii) 提案された DRL ベースのパス追跡アルゴリズムをトレーニングするためのデジタル ツインとして機能するために使用されます。
実験結果により、移動ロボットの位置推定を改善する FEKF の能力が確認されました。
さらに、DRL 経路追跡戦略の有効性は、トレーニング中に考慮されなかった操作に沿って実験的にテストされており、AI ベースのソリューションがモデルベースの制御戦略やデモンストレーターを上回る能力があることも示されています。
ベンチマーク コントローラーとの比較は、一連の主要業績評価指標を通じて定量的に評価されます。

要約(オリジナル)

Mobile robotic systems are becoming increasingly popular. These systems are used in various indoor applications, raging from warehousing and manufacturing to test benches for assessment of advanced control strategies, such as artificial intelligence (AI)-based control solutions, just to name a few. Scaled robotic cars are commonly equipped with a hierarchical control acthiecture that includes tasks dedicated to vehicle state estimation and control. This paper covers both aspects by proposing (i) a federeted extended Kalman filter (FEKF), and (ii) a novel deep reinforcement learning (DRL) path tracking controller trained via an expert demonstrator to expedite the learning phase and increase robustess to the simulation-to-reality gap. The paper also presents the formulation of a vehicle model along with an effective yet simple procedure for identifying tis paramters. The experimentally validated model is used for (i) supporting the design of the FEKF and (ii) serving as a digital twin for training the proposed DRL-based path tracking algorithm. Experimental results confirm the ability of the FEKF to improve the estimate of the mobile robot’s position. Furthermore, the effectiveness of the DRL path tracking strateguy is experimentally tested along manoeuvres not considered during training, showing also the ability of the AI-based solution to outpeform model-based control strategies and the demonstrator. The comparison with benchmraking controllers is quantitavely evalueted through a set of key performance indicators.

arxiv情報

著者 Carmine Caponio,Pietro Stano,Raffaele Carli,Ignazio Olivieri,Daniele Ragone,Aldo Sorniotti,Umberto Montanaro
発行日 2024-01-10 14:40:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク