3D Multi-Object Tracking with Semi-Supervised GRU-Kalman Filter

要約

環境認識の基本コンポーネントである 3D マルチオブジェクト追跡 (MOT) は、自動運転やロボット センシングなどのインテリジェント システムにとって不可欠です。
Tracking-by-Detection フレームワークは近年優れたパフォーマンスを示していますが、現実世界のシナリオでのアプリケーションは大きな課題に直面しています。
複雑な環境における物体の動きは多くの場合高度に非線形ですが、既存の方法は通常、動きの線形近似に依存しています。
さらに、システム ノイズはガウス分布としてモデル化されることが多く、ノイズ ダイナミクスの真の複雑さを捉えることができません。
これらの過度に単純化されたモデリングの仮定は、追跡精度の大幅な低下につながる可能性があります。
これに対処するために、学習可能なカルマン フィルターをモーション モジュールに導入する GRU ベースの MOT 手法を提案します。
このアプローチでは、データ駆動型学習を通じてオブジェクトの運動特性を学習できるため、手動によるモデル設計やモデルエラーの必要性が回避されます。
同時に、アノテーションと軌跡の間の誤った関連付けによって引き起こされる異常な監視を回避するために、収束速度を加速し、モデルの堅牢性を向上させる半教師あり学習戦略を設計します。
nuScenes および Argoverse2 データセットの評価実験により、当社のシステムが従来の TBD 手法と比較して優れたパフォーマンスと大きな可能性を発揮することが実証されました。

要約(オリジナル)

3D Multi-Object Tracking (MOT), a fundamental component of environmental perception, is essential for intelligent systems like autonomous driving and robotic sensing. Although Tracking-by-Detection frameworks have demonstrated excellent performance in recent years, their application in real-world scenarios faces significant challenges. Object movement in complex environments is often highly nonlinear, while existing methods typically rely on linear approximations of motion. Furthermore, system noise is frequently modeled as a Gaussian distribution, which fails to capture the true complexity of the noise dynamics. These oversimplified modeling assumptions can lead to significant reductions in tracking precision. To address this, we propose a GRU-based MOT method, which introduces a learnable Kalman filter into the motion module. This approach is able to learn object motion characteristics through data-driven learning, thereby avoiding the need for manual model design and model error. At the same time, to avoid abnormal supervision caused by the wrong association between annotations and trajectories, we design a semi-supervised learning strategy to accelerate the convergence speed and improve the robustness of the model. Evaluation experiment on the nuScenes and Argoverse2 datasets demonstrates that our system exhibits superior performance and significant potential compared to traditional TBD methods.

arxiv情報

著者 Xiaoxiang Wang,Jiaxin Liu,Miaojie Feng,Zhaoxing Zhang,Xin Yang
発行日 2024-11-13 08:34:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク