要約
3D マルチオブジェクト トラッキング (MOT) は、周囲のオブジェクトの動作軌跡を提供することで、移動ロボットが十分な情報に基づいた動作計画とナビゲーション タスクを実行できるようにします。
ただし、既存の 3D MOT 手法は通常、単一の類似性メトリックと物理モデルを使用して、すべてのオブジェクトのデータ関連付けと状態推定を実行します。
大規模な最新のデータセットと実際のシーンでは、一般に独特の幾何学的特性と動きパターンを示すさまざまなオブジェクト カテゴリが存在します。
このように、このような区別により、さまざまなオブジェクト カテゴリが同じ標準の下で異なる動作をすることが可能になり、その結果、軌跡と検出の間で誤った一致が発生し、下流のタスク (ナビゲーションなど) の信頼性が危険にさらされることになります。
この目的に向けて、我々は、追跡者がオブジェクト カテゴリごとに最適な追跡基準を選択できるようにする、Tracking-By-Detection フレームワークに基づく効率的な 3D MOT 手法である Poly-MOT を提案します。
具体的には、Poly-MOT は、さまざまなオブジェクト カテゴリに対してさまざまなモーション モデルを活用して、異なる種類のモーションを正確に特徴付けます。
また、オブジェクトの高度に非線形な動きを正確に記述するために、オブジェクトの剛構造の制約を特定の運動モデルに導入します。
さらに、オブジェクトがカテゴリの 3 つのカスタム メトリックから最適な類似性メトリックを見つけ、一致の欠落を減らすことができるように、2 段階のデータ関連付け戦略を導入します。
NuScenes データセットでは、私たちが提案した手法は 75.4\% AMOTA という最先端のパフォーマンスを達成しました。
コードは https://github.com/lixiaoyu2000/Poly-MOT で入手できます。
要約(オリジナル)
3D Multi-object tracking (MOT) empowers mobile robots to accomplish well-informed motion planning and navigation tasks by providing motion trajectories of surrounding objects. However, existing 3D MOT methods typically employ a single similarity metric and physical model to perform data association and state estimation for all objects. With large-scale modern datasets and real scenes, there are a variety of object categories that commonly exhibit distinctive geometric properties and motion patterns. In this way, such distinctions would enable various object categories to behave differently under the same standard, resulting in erroneous matches between trajectories and detections, and jeopardizing the reliability of downstream tasks (navigation, etc.). Towards this end, we propose Poly-MOT, an efficient 3D MOT method based on the Tracking-By-Detection framework that enables the tracker to choose the most appropriate tracking criteria for each object category. Specifically, Poly-MOT leverages different motion models for various object categories to characterize distinct types of motion accurately. We also introduce the constraint of the rigid structure of objects into a specific motion model to accurately describe the highly nonlinear motion of the object. Additionally, we introduce a two-stage data association strategy to ensure that objects can find the optimal similarity metric from three custom metrics for their categories and reduce missing matches. On the NuScenes dataset, our proposed method achieves state-of-the-art performance with 75.4\% AMOTA. The code is available at https://github.com/lixiaoyu2000/Poly-MOT
arxiv情報
著者 | Xiaoyu Li,Tao Xie,Dedong Liu,Jinghan Gao,Kun Dai,Zhiqiang Jiang,Lijun Zhao,Ke Wang |
発行日 | 2023-07-31 13:51:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google