要約
現実世界の自動運転システムは、まれで多様な交通シナリオに直面して安全な意思決定を下す必要があります。
現在の最先端のプランナーは、主に nuScenes (開ループ) や nuPlan (閉ループ) などの実世界のデータセットで評価されます。
特に、nuPlan は実世界のデータと閉ループに基づいているため、表現力豊かな評価方法であるように見えますが、基本的な運転シナリオをほとんどカバーしています。
このため、めったに見られない状況を一般化するプランナーの能力を判断することが困難になります。
したがって、いくつかのエッジケースと困難な運転シナリオを含む新しい閉ループベンチマーク interPlan を提案します。
私たちは既存の最先端のプランナーをベンチマークで評価し、ルールベースのプランナーも学習ベースのプランナーも interPlan シナリオを安全にナビゲートできないことを示しました。
最近進化している方向性は、一般化を処理するために大規模言語モデル (LLM) のような基礎モデルを使用することです。
私たちは LLM のみのプランナーを評価し、ベンチマークで最先端のパフォーマンスを達成する LLM ベースの動作プランナーとルールベースのモーション プランナーを組み合わせた新しいハイブリッド プランナーを導入します。
要約(オリジナル)
Real-world autonomous driving systems must make safe decisions in the face of rare and diverse traffic scenarios. Current state-of-the-art planners are mostly evaluated on real-world datasets like nuScenes (open-loop) or nuPlan (closed-loop). In particular, nuPlan seems to be an expressive evaluation method since it is based on real-world data and closed-loop, yet it mostly covers basic driving scenarios. This makes it difficult to judge a planner’s capabilities to generalize to rarely-seen situations. Therefore, we propose a novel closed-loop benchmark interPlan containing several edge cases and challenging driving scenarios. We assess existing state-of-the-art planners on our benchmark and show that neither rule-based nor learning-based planners can safely navigate the interPlan scenarios. A recently evolving direction is the usage of foundation models like large language models (LLM) to handle generalization. We evaluate an LLM-only planner and introduce a novel hybrid planner that combines an LLM-based behavior planner with a rule-based motion planner that achieves state-of-the-art performance on our benchmark.
arxiv情報
著者 | Marcel Hallgarten,Julian Zapata,Martin Stoll,Katrin Renz,Andreas Zell |
発行日 | 2024-09-04 11:34:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google