Evaluation of MPC-based Imitation Learning for Human-like Autonomous Driving

要約

この研究では、人間のような自動運転のアプリケーションのための模倣学習 (IL) と微分可能モデル予測制御 (MPC) の組み合わせを評価および分析します。
MPC を階層型学習ベースのポリシーと組み合わせ、安全性、快適性、人間の運転特性との類似性に関連する指標を使用して、開ループおよび閉ループでそのパフォーマンスを測定します。
また、MPC で使用される状態空間モデルを使用して時間によるポリシー勾配を近似し、より堅牢な学習を実現するために閉ループ トレーニングで開ループの動作クローニングを強化することの価値も実証します。
私たちは、固定ベースの運転シミュレーターで収集されたデモンストレーションから学習した車線維持制御システムの実験評価を実行し、私たちの模倣ポリシーが人間の運転スタイルの好みに近づいていることを示します。

要約(オリジナル)

This work evaluates and analyzes the combination of imitation learning (IL) and differentiable model predictive control (MPC) for the application of human-like autonomous driving. We combine MPC with a hierarchical learning-based policy, and measure its performance in open-loop and closed-loop with metrics related to safety, comfort and similarity to human driving characteristics. We also demonstrate the value of augmenting open-loop behavioral cloning with closed-loop training for a more robust learning, approximating the policy gradient through time with the state space model used by the MPC. We perform experimental evaluations on a lane keeping control system, learned from demonstrations collected on a fixed-base driving simulator, and show that our imitative policies approach the human driving style preferences.

arxiv情報

著者 Flavia Sofia Acerbo,Jan Swevers,Tinne Tuytelaars,Tong Duy Son
発行日 2023-06-26 13:07:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク