HiLO: High-Level Object Fusion for Autonomous Driving using Transformers

要約

センサデータのフュージョンは、自律走行におけるロバストな環境認識のために不可欠である。学習ベースのフュージョンアプローチでは、主に特徴レベルのフュージョンを使用して高いパフォーマンスを達成するが、その複雑さとハードウェア要件により、量産車に近い車両での適用が制限される。高レベルのフュージョン手法は、より低い計算要件でロバスト性を提供します。この分野では、カルマンフィルタのような伝統的な手法が主流です。本論文では、アダプテッド・カルマン・フィルタ(AKF)を修正し、HiLOと呼ばれる新しいトランスフォーマベースのハイレベル・オブジェクト・フュージョン法を提案する。実験結果は、$25.9$パーセンテージポイントの$textrm{F}_1$スコアの改善と$6.1$パーセンテージポイントの平均IoUの改善を示す。新しい大規模実世界データセットでの評価により、提案アプローチの有効性が実証された。さらに、都市と高速道路のシナリオ間のクロスドメイン評価により、その汎用性を検証する。コード、データ、モデルは https://github.com/rst-tu-dortmund/HiLO で入手可能である。

要約(オリジナル)

The fusion of sensor data is essential for a robust perception of the environment in autonomous driving. Learning-based fusion approaches mainly use feature-level fusion to achieve high performance, but their complexity and hardware requirements limit their applicability in near-production vehicles. High-level fusion methods offer robustness with lower computational requirements. Traditional methods, such as the Kalman filter, dominate this area. This paper modifies the Adapted Kalman Filter (AKF) and proposes a novel transformer-based high-level object fusion method called HiLO. Experimental results demonstrate improvements of $25.9$ percentage points in $\textrm{F}_1$ score and $6.1$ percentage points in mean IoU. Evaluation on a new large-scale real-world dataset demonstrates the effectiveness of the proposed approaches. Their generalizability is further validated by cross-domain evaluation between urban and highway scenarios. Code, data, and models are available at https://github.com/rst-tu-dortmund/HiLO .

arxiv情報

著者 Timo Osterburg,Franz Albers,Christopher Diehl,Rajesh Pushparaj,Torsten Bertram
発行日 2025-06-03 07:44:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク