要約
現在の自動運転車は主に限られた地域内で動作しますが、より広範なアプリケーションに対する需要が増加しています。
ただし、モデルが拡大するにつれて、限られた能力は、新しいシナリオに適応するための重要な課題になります。
単一のモノリシックモデルを使用して、新しい状況のモデルを改善することはますます困難になっています。
この問題に対処するために、プランナー自体を永久に変更することなく、ローカルドライビングデータを使用して基本的な運転プランナーを動的に強化するという概念を紹介します。
このアプローチは、動的にローカルエンハンスメント(DLE)プランナーと呼ばれ、プランナーのサイズを大幅に拡大せずに自律運転システムのスケーラビリティを改善することを目的としています。
私たちのアプローチでは、局所観察データから領域固有の駆動機能を抽出するグラフニューラルネットワークと組み合わせた位置変化のマルコフ決定プロセスの定式化を紹介します。
学習された機能は、周囲のオブジェクトの局所的な動作を説明しており、基本的な強化学習ベースのポリシーを強化するために活用されます。
複数のシナリオでアプローチを評価し、1回の運転モデルと比較しました。
結果は、私たちの方法が、より軽いスケールを維持しながら、安全性(衝突率)と平均報酬の両方でベースラインポリシーを上回ることを示しています。
このアプローチには、主にデバイス運転モデルを大幅に拡大する必要なく、大規模な自動運転車に利益をもたらす可能性があります。
要約(オリジナル)
Current autonomous vehicles operate primarily within limited regions, but there is increasing demand for broader applications. However, as models scale, their limited capacity becomes a significant challenge for adapting to novel scenarios. It is increasingly difficult to improve models for new situations using a single monolithic model. To address this issue, we introduce the concept of dynamically enhancing a basic driving planner with local driving data, without permanently modifying the planner itself. This approach, termed the Dynamically Local-Enhancement (DLE) Planner, aims to improve the scalability of autonomous driving systems without significantly expanding the planner’s size. Our approach introduces a position-varying Markov Decision Process formulation coupled with a graph neural network that extracts region-specific driving features from local observation data. The learned features describe the local behavior of the surrounding objects, which is then leveraged to enhance a basic reinforcement learning-based policy. We evaluated our approach in multiple scenarios and compared it with a one-for-all driving model. The results show that our method outperforms the baseline policy in both safety (collision rate) and average reward, while maintaining a lighter scale. This approach has the potential to benefit large-scale autonomous vehicles without the need for largely expanding on-device driving models.
arxiv情報
| 著者 | Nanshan Deng,Weitao Zhou,Bo Zhang,Junze Wen,Kun Jiang,Zhong Cao,Diange Yang |
| 発行日 | 2025-02-28 15:17:20+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google