Does Unpredictability Influence Driving Behavior?

要約

この論文では、運転操作を実行する自車に対する周囲の車の予測不可能性の影響を調査します。
最大エントロピー逆強化学習を使用して、高速道路で車線変更を行う自車の報酬関数をモデル化します。
周囲の車の予測不可能性に基づいて新しい特徴を定義し、それを報酬関数で使用します。
人間のデータから 2 つの報酬関数 (ベースラインと、定義した予測不可能性の特徴を組み込んだもの) を学習し、そのパフォーマンスを定量的および定性的評価と比較します。
私たちの評価では、予測不可能性機能を組み込むことで、人間が生成したテスト データの適合性が向上することが実証されました。
これらの結果は、運転行動に対する予測不可能性の影響についてのさらなる調査を促すものです。

要約(オリジナル)

In this paper we investigate the effect of the unpredictability of surrounding cars on an ego-car performing a driving maneuver. We use Maximum Entropy Inverse Reinforcement Learning to model reward functions for an ego-car conducting a lane change in a highway setting. We define a new feature based on the unpredictability of surrounding cars and use it in the reward function. We learn two reward functions from human data: a baseline and one that incorporates our defined unpredictability feature, then compare their performance with a quantitative and qualitative evaluation. Our evaluation demonstrates that incorporating the unpredictability feature leads to a better fit of human-generated test data. These results encourage further investigation of the effect of unpredictability on driving behavior.

arxiv情報

著者 Sepehr Samavi,Florian Shkurti,Angela Schoellig
発行日 2023-07-28 03:55:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク