Zero-Shot Policy Transferability for the Control of a Scale Autonomous Vehicle

要約

社内で開発したシミュレーション インフラストラクチャを使用して、大規模自動運転車に関連する制御ポリシーのゼロ ショット ポリシー転送可能性を達成する研究について報告します。
当社は、現実世界のデータのトレーニング (ゼロショット転送) を必要としないポリシーの実装に重点を置いており、以前の研究で検証されたものではなく、社内で開発されています。
これを行うには、一連の円形参照軌道のみでトレーニングされるニューラル ネットワーク (NN) コントローラーを実装します。
使用されるセンサーは RTK-GPS と IMU で、後者は方位を提供するために使用されます。
NN コントローラーは、人間のドライバー (人間によるループ シミュレーションによる) またはモデル予測制御 (MPC) 戦略のいずれかを使用してトレーニングされます。
これら 2 つのアプローチを 2 つの操作シナリオと組み合わせて実証します。車両はウェイポイントで定義された軌道を一定速度でたどります。
そして車両は、車両のウェイポイントで定義された軌道に沿って変化する速度プロファイルに従います。
この研究の主な貢献は、汎用の社内開発シミュレーション プラットフォームを使用してトレーニングされた新しいフィードフォワード NN コントローラーと組み合わせたゼロショット転送のデモンストレーションです。

要約(オリジナル)

We report on a study that employs an in-house developed simulation infrastructure to accomplish zero shot policy transferability for a control policy associated with a scale autonomous vehicle. We focus on implementing policies that require no real world data to be trained (Zero-Shot Transfer), and are developed in-house as opposed to being validated by previous works. We do this by implementing a Neural Network (NN) controller that is trained only on a family of circular reference trajectories. The sensors used are RTK-GPS and IMU, the latter for providing heading. The NN controller is trained using either a human driver (via human in the loop simulation), or a Model Predictive Control (MPC) strategy. We demonstrate these two approaches in conjunction with two operation scenarios: the vehicle follows a waypoint-defined trajectory at constant speed; and the vehicle follows a speed profile that changes along the vehicle’s waypoint-defined trajectory. The primary contribution of this work is the demonstration of Zero-Shot Transfer in conjunction with a novel feed-forward NN controller trained using a general purpose, in-house developed simulation platform.

arxiv情報

著者 Harry Zhang,Stefan Caldararu,Sriram Ashokkumar,Ishaan Mahajan,Aaron Young,Alexis Ruiz,Huzaifa Unjhawala,Luning Bakke,Dan Negrut
発行日 2023-09-18 15:30:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク