Dynamically Conservative Self-Driving Planner for Long-Tail Cases

要約

自動運転車(SDV)は現実のものとなりつつあるが、自然走行時には依然として「ロングテール」の課題に悩まされている。SDVは、訓練したデータセットに含まれていないような、稀で安全上重要なケースに継続的に遭遇することになる。安全保証プランナーの中には、起こりうるすべてのケースに対して保守的になることでこの問題を解決しているものもあるが、これは運転の機動性に大きく影響する可能性がある。このため、本研究では、各ケースの「ロングテール」率に応じて保守的なレベルを自動的に調整する手法を提案し、動的保守プランナー(DCP)と名付けた。まず、「ロングテール率」をSDVが運転ケースに合格する自信と定義する。この率は、セーフクリティカルな事象の発生確率を示すもので、過去のデータを用いて統計学的なブートストラップ法を用いて推定される。次に、強化学習ベースのプランナーが設計され、異なる保守的なレベルを持つ候補政策が含まれる。最終的な方針は、推定された「ロングテール」率に基づき最適化される。このようにして、DCPは、信頼度の低い「ロングテール」ケースではより保守的に、それ以外のケースでは効率的になるように自動的に調整されるように設計されている。DCPは、CARLAシミュレータにおいて、「ロングテール」が分布する訓練データを用いた運転ケースで評価された。その結果、DCPは、潜在的なリスクを特定するために、「ロングテール」率を正確に推定できることが示された。その結果、DCPは、ロングテール率に基づき、他の典型的なケースでは平均速度に影響を与えない一方で、保守的な判断を用いてロングテールケースでの衝突の可能性を自動的に回避することがわかった。したがって、DCPは、保守的なレベルを固定したベースライン(例えば、常に保守的なプランナー)よりも、安全で効率的である。本研究は、グローバルな保守的設定に頼ることなく、予期せぬ運転ケースにおいてSDVの性能を保証する技術を提供し、「ロングテール」問題の実践的解決に寄与する。

要約(オリジナル)

Self-driving vehicles (SDVs) are becoming reality but still suffer from ‘long-tail’ challenges during natural driving: the SDVs will continually encounter rare, safety-critical cases that may not be included in the dataset they were trained. Some safety-assurance planners solve this problem by being conservative in all possible cases, which may significantly affect driving mobility. To this end, this work proposes a method to automatically adjust the conservative level according to each case’s ‘long-tail’ rate, named dynamically conservative planner (DCP). We first define the ‘long-tail’ rate as an SDV’s confidence to pass a driving case. The rate indicates the probability of safe-critical events and is estimated using the statistics bootstrapped method with historical data. Then, a reinforcement learning-based planner is designed to contain candidate policies with different conservative levels. The final policy is optimized based on the estimated ‘long-tail’ rate. In this way, the DCP is designed to automatically adjust to be more conservative in low-confidence ‘long-tail’ cases while keeping efficient otherwise. The DCP is evaluated in the CARLA simulator using driving cases with ‘long-tail’ distributed training data. The results show that the DCP can accurately estimate the ‘long-tail’ rate to identify potential risks. Based on the rate, the DCP automatically avoids potential collisions in ‘long-tail’ cases using conservative decisions while not affecting the average velocity in other typical cases. Thus, the DCP is safer and more efficient than the baselines with fixed conservative levels, e.g., an always conservative planner. This work provides a technique to guarantee SDV’s performance in unexpected driving cases without resorting to a global conservative setting, which contributes to solving the ‘long-tail’ problem practically.

arxiv情報

著者 Weitao Zhou,Zhong Cao,Nanshan Deng,Xiaoyu Liu,Kun Jiang,Diange Yang
発行日 2023-05-12 14:11:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.RO パーマリンク