Tactical Decision Making for Autonomous Trucks by Deep Reinforcement Learning with Total Cost of Operation Based Reward

要約

私たちは、自動運転トラックにおける戦術的意思決定、特に高速道路シナリオでのアダプティブ クルーズ コントロール (ACC) と車線変更操作のための深層強化学習フレームワークを開発します。
私たちの結果は、物理モデルに基づいて、強化学習エージェントと低レベルのコントローラーの間で高レベルの意思決定プロセスと低レベルの制御アクションを分離することが有益であることを示しています。
以下では、さまざまなアプローチを使用して、トラックの総運用コスト (TCOP) に基づいた現実的で多目的の報酬関数によるパフォーマンスの最適化を検討します。
報酬コンポーネントに重みを追加すること、報酬コンポーネントを正規化すること、カリキュラム学習テクニックを使用することによって行われます。

要約(オリジナル)

We develop a deep reinforcement learning framework for tactical decision making in an autonomous truck, specifically for Adaptive Cruise Control (ACC) and lane change maneuvers in a highway scenario. Our results demonstrate that it is beneficial to separate high-level decision-making processes and low-level control actions between the reinforcement learning agent and the low-level controllers based on physical models. In the following, we study optimizing the performance with a realistic and multi-objective reward function based on Total Cost of Operation (TCOP) of the truck using different approaches; by adding weights to reward components, by normalizing the reward components and by using curriculum learning techniques.

arxiv情報

著者 Deepthi Pathare,Leo Laine,Morteza Haghir Chehreghani
発行日 2024-03-11 08:58:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク