Centaur: Robust End-to-End Autonomous Driving with Test-Time Training

要約

展開中にエンドツーエンドの自動運転車の複雑な意思決定システムにどのように依存できますか?
一般的な解決策の1つは、ルール違反のために計画された軌道をチェックし、必要に応じて事前に定義された安全なアクションに置き換える「フォールバック層」を持つことです。
別のアプローチでは、プランナーの決定を調整して、道路レイアウトや検出された障害などの追加のシステム予測を使用して、事前に定義された「コスト関数」を最小限に抑えることです。
ただし、これらの事前にプログラムされたルールまたはコスト関数は、新しいトレーニングデータで学習して改善することはできず、しばしば過度に保守的な行動をとることができます。
この作業では、手作業のルールやコスト関数に依存することなく、テスト時間トレーニングを介してプランナーの動作を更新するCentaur(不確実性を使用したテスト時間トレーニングのクラスターエントロピー)を提案します。
代わりに、プランナーの決定の不確実性を測定して最小化します。
このために、クラスターエントロピーと呼ばれる新しい不確実性尺度を開発します。これは、シンプルで解釈可能で、最先端の計画アルゴリズムと互換性があります。
以前のテスト時間時間ステップで収集されたデータを使用して、クラスターエントロピーを最小限に抑える勾配を使用してモデルのパラメーターの更新を実行します。
推論の前にこの唯一のグラデーションアップデートのみで、Centaurは大幅な改善を示し、Navtestリーダーボードで最初にランク付けされ、衝突する時間などの安全性の高いメトリックが顕著に利益を得ます。
セナリオごとの詳細な洞察を提供するために、以前は未発見だった運転モデル​​の障害モードを強調する挑戦的な新しいベンチマークであるNavsafeも紹介します。

要約(オリジナル)

How can we rely on an end-to-end autonomous vehicle’s complex decision-making system during deployment? One common solution is to have a “fallback layer” that checks the planned trajectory for rule violations and replaces it with a pre-defined safe action if necessary. Another approach involves adjusting the planner’s decisions to minimize a pre-defined “cost function” using additional system predictions such as road layouts and detected obstacles. However, these pre-programmed rules or cost functions cannot learn and improve with new training data, often resulting in overly conservative behaviors. In this work, we propose Centaur (Cluster Entropy for Test-time trAining using Uncertainty) which updates a planner’s behavior via test-time training, without relying on hand-engineered rules or cost functions. Instead, we measure and minimize the uncertainty in the planner’s decisions. For this, we develop a novel uncertainty measure, called Cluster Entropy, which is simple, interpretable, and compatible with state-of-the-art planning algorithms. Using data collected at prior test-time time-steps, we perform an update to the model’s parameters using a gradient that minimizes the Cluster Entropy. With only this sole gradient update prior to inference, Centaur exhibits significant improvements, ranking first on the navtest leaderboard with notable gains in safety-critical metrics such as time to collision. To provide detailed insights on a per-scenario basis, we also introduce navsafe, a challenging new benchmark, which highlights previously undiscovered failure modes of driving models.

arxiv情報

著者 Chonghao Sima,Kashyap Chitta,Zhiding Yu,Shiyi Lan,Ping Luo,Andreas Geiger,Hongyang Li,Jose M. Alvarez
発行日 2025-03-14 17:59:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク