要約
私たちは、自動運転トラックにおける戦術的意思決定、特に高速道路シナリオでのアダプティブ クルーズ コントロール (ACC) と車線変更操作のための深層強化学習フレームワークを開発します。
私たちの結果は、物理モデルに基づいて、強化学習エージェントと低レベルのコントローラーの間で高レベルの意思決定プロセスと低レベルの制御アクションを分離することが有益であることを示しています。
以下では、さまざまなアプローチを使用して、トラックの総運用コスト (TCOP) に基づいた現実的で多目的の報酬関数によるパフォーマンスの最適化を検討します。
報酬コンポーネントに重みを追加すること、報酬コンポーネントを正規化すること、カリキュラム学習テクニックを使用することによって行われます。
要約(オリジナル)
We develop a deep reinforcement learning framework for tactical decision making in an autonomous truck, specifically for Adaptive Cruise Control (ACC) and lane change maneuvers in a highway scenario. Our results demonstrate that it is beneficial to separate high-level decision-making processes and low-level control actions between the reinforcement learning agent and the low-level controllers based on physical models. In the following, we study optimizing the performance with a realistic and multi-objective reward function based on Total Cost of Operation (TCOP) of the truck using different approaches; by adding weights to reward components, by normalizing the reward components and by using curriculum learning techniques.
arxiv情報
著者 | Deepthi Pathare,Leo Laine,Morteza Haghir Chehreghani |
発行日 | 2024-03-11 08:58:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google