社内で開発したシミュレーション インフラストラクチャを使用して、大規模自動運転車に関連する制御ポリシーのゼロ ショット ポリシー転送可能性を達成する研究について報告します。
当社は、現実世界のデータのトレーニング (ゼロショット転送) を必要としないポリシーの実装に重点を置いており、以前の研究で検証されたものではなく、社内で開発されています。
これを行うには、一連の円形参照軌道のみでトレーニングされるニューラル ネットワーク (NN) コントローラーを実装します。
使用されるセンサーは RTK-GPS と IMU で、後者は方位を提供するために使用されます。
NN コントローラーは、人間のドライバー (人間によるループ シミュレーションによる) またはモデル予測制御 (MPC) 戦略のいずれかを使用してトレーニングされます。
これら 2 つのアプローチを 2 つの操作シナリオと組み合わせて実証します。車両はウェイポイントで定義された軌道を一定速度でたどります。
この研究の主な貢献は、汎用の社内開発シミュレーション プラットフォームを使用してトレーニングされた新しいフィードフォワード NN コントローラーと組み合わせたゼロショット転送のデモンストレーションです。
We report on a study that employs an in-house developed simulation infrastructure to accomplish zero shot policy transferability for a control policy associated with a scale autonomous vehicle. We focus on implementing policies that require no real world data to be trained (Zero-Shot Transfer), and are developed in-house as opposed to being validated by previous works. We do this by implementing a Neural Network (NN) controller that is trained only on a family of circular reference trajectories. The sensors used are RTK-GPS and IMU, the latter for providing heading. The NN controller is trained using either a human driver (via human in the loop simulation), or a Model Predictive Control (MPC) strategy. We demonstrate these two approaches in conjunction with two operation scenarios: the vehicle follows a waypoint-defined trajectory at constant speed; and the vehicle follows a speed profile that changes along the vehicle’s waypoint-defined trajectory. The primary contribution of this work is the demonstration of Zero-Shot Transfer in conjunction with a novel feed-forward NN controller trained using a general purpose, in-house developed simulation platform.
著者 | Harry Zhang,Stefan Caldararu,Sriram Ashokkumar,Ishaan Mahajan,Aaron Young,Alexis Ruiz,Huzaifa Unjhawala,Luning Bakke,Dan Negrut |
発行日 | 2023-09-18 15:30:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google