Exploiting Prior Knowledge in Preferential Learning of Individualized Autonomous Vehicle Driving Styles

要約

自動化された車両の軌道計画は、一般に、動く地平線(モデル予測制御)にわたって最適化を採用しています。コスト関数は、結果として生じる運転スタイルに大きく影響します。
ただし、乗客が好む運転スタイルをもたらす適切なコスト関数を見つけることは、継続的な課題のままです。
私たちは、乗客の好みを繰り返し照会することにより、コスト関数を学習するために優先的なベイジアンの最適化を採用しています。
パラメーター空間の次元が増加するため、優先学習アプローチは、限られた数の実験で適切な最適なものを見つけるのに苦労し、パラメーター空間を探索するときに乗客を不快感にさらします。
優先的なベイジアン最適化フレームワークに事前知識を組み込むことにより、これらの課題に対処します。
私たちの方法は、パラメーターサンプリングをガイドするために、実際の人間の運転データから仮想意思決定者を構築します。
シミュレーション実験では、既存の優先的なベイジアン最適化アプローチと比較して、以前の知識情報に基づいた学習手順のより速い収束を実現し、サンプリングされた運転スタイルの不十分なスタイルの数を減らします。

要約(オリジナル)

Trajectory planning for automated vehicles commonly employs optimization over a moving horizon – Model Predictive Control – where the cost function critically influences the resulting driving style. However, finding a suitable cost function that results in a driving style preferred by passengers remains an ongoing challenge. We employ preferential Bayesian optimization to learn the cost function by iteratively querying a passenger’s preference. Due to increasing dimensionality of the parameter space, preference learning approaches might struggle to find a suitable optimum with a limited number of experiments and expose the passenger to discomfort when exploring the parameter space. We address these challenges by incorporating prior knowledge into the preferential Bayesian optimization framework. Our method constructs a virtual decision maker from real-world human driving data to guide parameter sampling. In a simulation experiment, we achieve faster convergence of the prior-knowledge-informed learning procedure compared to existing preferential Bayesian optimization approaches and reduce the number of inadequate driving styles sampled.

arxiv情報

著者 Lukas Theiner,Sebastian Hirt,Alexander Steinke,Rolf Findeisen
発行日 2025-03-19 16:47:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SY, eess.SY パーマリンク