RobMOT: Robust 3D Multi-Object Tracking by Observational Noise and State Estimation Drift Mitigation on LiDAR PointCloud

要約

この研究では、カルマンフィルタの状態推定ドリフトに対処し、正当な軌跡を識別することに焦点を当て、最近の3Dトラッキングバイディテクション法の限界に対処する。現在の手法は、ゴースト軌道を防ぐために、検出スコアを用いた誤検出の閾値ベースのフィルタリングに大きく依存している。しかし、このアプローチは、検出スコアが低下する傾向があり、閾値を超える誤検出を引き起こす可能性がある、遠方の物体や部分的に隠蔽された物体に対しては不十分である。さらに、文献では一般的に検出を物体の正確な位置特定として扱っている。我々の研究により、検出結果のノイズが定位情報に影響を与え、閉塞物体の軌跡ドリフトを引き起こし、回復の妨げになることが明らかになった。この目的のために、我々は、正当なトラックとゴーストトラックを時間的に区別する新しいオンライントラック有効性メカニズムを、入力観測に対する多段階の観測ゲーティングプロセスと共に提案する。このメカニズムは、HOTAで$6.28%、MOTAで$17.87%増加し、トラッキング性能を大幅に改善する。また、カルマンフィルタの改良を導入することで、軌道ドリフトにおけるノイズ緩和を強化し、閉塞物体に対してよりロバストな状態推定を実現する。我々のフレームワークであるRobMOTは、様々な検出器において、ディープラーニングアプローチを含む最先端手法を凌駕し、HOTAにおいて最大$4$、MOTAにおいて最大$6$のマージンを達成した。RobMOTは、長時間のオクルージョンや遠くのオブジェクトの追跡などの困難な条件下で優れており、処理待ち時間を最大59%まで改善する。

要約(オリジナル)

This work addresses limitations in recent 3D tracking-by-detection methods, focusing on identifying legitimate trajectories and addressing state estimation drift in Kalman filters. Current methods rely heavily on threshold-based filtering of false positive detections using detection scores to prevent ghost trajectories. However, this approach is inadequate for distant and partially occluded objects, where detection scores tend to drop, potentially leading to false positives exceeding the threshold. Additionally, the literature generally treats detections as precise localizations of objects. Our research reveals that noise in detections impacts localization information, causing trajectory drift for occluded objects and hindering recovery. To this end, we propose a novel online track validity mechanism that temporally distinguishes between legitimate and ghost tracks, along with a multi-stage observational gating process for incoming observations. This mechanism significantly improves tracking performance, with a $6.28\%$ in HOTA and a $17.87\%$ increase in MOTA. We also introduce a refinement to the Kalman filter that enhances noise mitigation in trajectory drift, leading to more robust state estimation for occluded objects. Our framework, RobMOT, outperforms state-of-the-art methods, including deep learning approaches, across various detectors, achieving up to a $4\%$ margin in HOTA and $6\%$ in MOTA. RobMOT excels under challenging conditions, such as prolonged occlusions and tracking distant objects, with up to a 59\% improvement in processing latency.

arxiv情報

著者 Mohamed Nagy,Naoufel Werghi,Bilal Hassan,Jorge Dias,Majid Khonji
発行日 2024-10-04 11:38:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク