要約
自律走行車(AV)は、安全性、信頼性、脱炭素化の観点から、道路交通モビリティの進歩を大幅に促進することができる。しかし、ダイナミックで多様な環境下での対話型走行における安全性と効率性の確保が、大規模なAV導入の主要な障壁となっています。近年、深層強化学習(DRL)が先進的なAIベースのアプローチとして登場し、AVがデータと相互作用から適応的に意思決定戦略を学習することを可能にしています。DRL戦略はその適応性により、複雑でダイナミック、かつ予測不可能な運転環境を扱うのに、従来のルールベースの手法よりも適しています。しかし、高速道路での障害物の回避や交差点での特定の出口への到達など、様々な走行シナリオには明確な課題が存在するため、異なるシナリオに特化した意思決定アルゴリズムが必要となります。対話型意思決定では多くのDRLアルゴリズムが提案されています。しかし、様々なシナリオにおけるこれらのDRLアルゴリズムの合理的なレビューは不足している。そのため、車両ユーザーや車両メーカーを含む多角的な視点からこれらのアルゴリズムを評価する包括的な評価が不可欠である。この調査では、典型的なシナリオにおける自律走行へのDRLアルゴリズムの適用をレビューし、道路の特徴と最近の進歩を要約する。シナリオには高速道路、オンランプ合流、ラウンドアバウト、信号のない交差点などが含まれる。さらに、DRLベースのアルゴリズムは、安全運転、運転効率、トレーニング効率、利己的でないこと、解釈可能性(DDTUI)の5つの合理的基準に基づいて評価される。DDTUIの各基準は、検討されたアルゴリズムとの関連で具体的に分析されている。最後に、今後のDRLに基づく意思決定アルゴリズムの課題をまとめる。
要約(オリジナル)
Autonomous vehicles (AVs) can significantly promote the advances in road transport mobility in terms of safety, reliability, and decarbonization. However, ensuring safety and efficiency in interactive during within dynamic and diverse environments is still a primary barrier to large-scale AV adoption. In recent years, deep reinforcement learning (DRL) has emerged as an advanced AI-based approach, enabling AVs to learn decision-making strategies adaptively from data and interactions. DRL strategies are better suited than traditional rule-based methods for handling complex, dynamic, and unpredictable driving environments due to their adaptivity. However, varying driving scenarios present distinct challenges, such as avoiding obstacles on highways and reaching specific exits at intersections, requiring different scenario-specific decision-making algorithms. Many DRL algorithms have been proposed in interactive decision-making. However, a rationale review of these DRL algorithms across various scenarios is lacking. Therefore, a comprehensive evaluation is essential to assess these algorithms from multiple perspectives, including those of vehicle users and vehicle manufacturers. This survey reviews the application of DRL algorithms in autonomous driving across typical scenarios, summarizing road features and recent advancements. The scenarios include highways, on-ramp merging, roundabouts, and unsignalized intersections. Furthermore, DRL-based algorithms are evaluated based on five rationale criteria: driving safety, driving efficiency, training efficiency, unselfishness, and interpretability (DDTUI). Each criterion of DDTUI is specifically analyzed in relation to the reviewed algorithms. Finally, the challenges for future DRL-based decision-making algorithms are summarized.
arxiv情報
著者 | Zhen Tian,Zhihao Lin,Dezong Zhao,Wenjing Zhao,David Flynn,Shuja Ansari,Chongfeng Wei |
発行日 | 2025-01-03 16:37:52+00:00 |
arxivサイト | arxiv_id(pdf) |