INTACT: Inducing Noise Tolerance through Adversarial Curriculum Training for LiDAR-based Safety-Critical Perception and Autonomy

要約

この研究では、安全性が重要視される知覚タスクにおいて、ノイズの多いLiDARデータに対するディープニューラルネットワーク(DNN)の頑健性を強化するために設計された、新しい2段階のフレームワークであるINTACTを紹介する。INTACTは、メタ学習と敵対的カリキュラム学習(ACT)を組み合わせることで、3D点群におけるデータの破損やスパース性がもたらす課題に体系的に対処する。メタ学習フェーズでは、タスクにとらわれない事前分布を教師ネットワークに与え、重要なデータ領域を特定するロバストな顕著性マップを生成できるようにする。ACTフェーズでは、これらの顕著性マップを活用し、生徒ネットワークを徐々に複雑なノイズパターンにさらすことで、的を絞った摂動とノイズ耐性の向上を実現する。INTACTの有効性は、KITTI、Argoverse、ModelNet40を含む多様なデータセットを用いた物体検出、追跡、分類ベンチマークに関する包括的な評価を通じて実証されている。その結果、INTACTは全てのタスクにおいてモデルの頑健性を最大20%向上させ、標準的な敵対的学習法やカリキュラム学習法よりも優れていることが示された。このフレームワークは、従来のトレーニング戦略の限界に対処するだけでなく、リソースに制約のあるセーフティ・クリティカルなシステムで実世界に展開するためのスケーラブルで効率的なソリューションを提供します。メタ学習と敵対的トレーニングを原理的に統合したINTACTは、セーフティクリティカルなアプリケーションにおけるノイズ耐性3D知覚の新しいパラダイムを確立します。INTACTは、KITTIの複数物体追跡精度(MOTA)を9.6%(64.1%→75.1%)、ガウスノイズ下で12.4%(52.5%→73.7%)向上させました。同様に、KITTIの平均平均精度(mAP)は、59.8%から69.8%(50%ポイント低下)、49.3%から70.9%(ガウスノイズ)に上昇し、セーフティクリティカルな物体追跡シナリオにおいてディープラーニングモデルの耐性を強化するフレームワークの能力が強調されました。

要約(オリジナル)

In this work, we present INTACT, a novel two-phase framework designed to enhance the robustness of deep neural networks (DNNs) against noisy LiDAR data in safety-critical perception tasks. INTACT combines meta-learning with adversarial curriculum training (ACT) to systematically address challenges posed by data corruption and sparsity in 3D point clouds. The meta-learning phase equips a teacher network with task-agnostic priors, enabling it to generate robust saliency maps that identify critical data regions. The ACT phase leverages these saliency maps to progressively expose a student network to increasingly complex noise patterns, ensuring targeted perturbation and improved noise resilience. INTACT’s effectiveness is demonstrated through comprehensive evaluations on object detection, tracking, and classification benchmarks using diverse datasets, including KITTI, Argoverse, and ModelNet40. Results indicate that INTACT improves model robustness by up to 20% across all tasks, outperforming standard adversarial and curriculum training methods. This framework not only addresses the limitations of conventional training strategies but also offers a scalable and efficient solution for real-world deployment in resource-constrained safety-critical systems. INTACT’s principled integration of meta-learning and adversarial training establishes a new paradigm for noise-tolerant 3D perception in safety-critical applications. INTACT improved KITTI Multiple Object Tracking Accuracy (MOTA) by 9.6% (64.1% -> 75.1%) and by 12.4% under Gaussian noise (52.5% -> 73.7%). Similarly, KITTI mean Average Precision (mAP) rose from 59.8% to 69.8% (50% point drop) and 49.3% to 70.9% (Gaussian noise), highlighting the framework’s ability to enhance deep learning model resilience in safety-critical object tracking scenarios.

arxiv情報

著者 Nastaran Darabi,Divake Kumar,Sina Tayebati,Amit Ranjan Trivedi
発行日 2025-02-04 00:02:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク