要約
この研究では、人間のような自動運転のアプリケーションのための模倣学習 (IL) と微分可能モデル予測制御 (MPC) の組み合わせを評価および分析します。
MPC を階層型学習ベースのポリシーと組み合わせ、安全性、快適性、人間の運転特性との類似性に関連する指標を使用して、開ループおよび閉ループでそのパフォーマンスを測定します。
また、MPC で使用される状態空間モデルを使用して時間によるポリシー勾配を近似し、より堅牢な学習を実現するために閉ループ トレーニングで開ループの動作クローニングを強化することの価値も実証します。
私たちは、固定ベースの運転シミュレーターで収集されたデモンストレーションから学習した車線維持制御システムの実験評価を実行し、私たちの模倣ポリシーが人間の運転スタイルの好みに近づいていることを示します。
要約(オリジナル)
This work evaluates and analyzes the combination of imitation learning (IL) and differentiable model predictive control (MPC) for the application of human-like autonomous driving. We combine MPC with a hierarchical learning-based policy, and measure its performance in open-loop and closed-loop with metrics related to safety, comfort and similarity to human driving characteristics. We also demonstrate the value of augmenting open-loop behavioral cloning with closed-loop training for a more robust learning, approximating the policy gradient through time with the state space model used by the MPC. We perform experimental evaluations on a lane keeping control system, learned from demonstrations collected on a fixed-base driving simulator, and show that our imitative policies approach the human driving style preferences.
arxiv情報
著者 | Flavia Sofia Acerbo,Jan Swevers,Tinne Tuytelaars,Tong Duy Son |
発行日 | 2023-06-26 13:07:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google