Group Regression for Query Based Object Detection and Tracking

要約

グループ回帰は、3D オブジェクト検出で一般的に使用され、ジョイント ヘッド内の類似クラスのボックス パラメーターを予測します。これは、類似性の利点を活用しながら、非常に類似しないクラスを分離することを目的としています。
クエリベースの認識方法では、これまでのところ、これは実現可能ではありません。
我々はこのギャップを埋め、特に自動運転のコンテキストにおける 3D ドメイン向けに設計されたマルチクラス グループ回帰を、既存の注意およびクエリベースの知覚アプローチに組み込む方法を提示します。
このアプローチによりトランスフォーマーベースの共同物体検出および追跡モデルを強化し、その動作とパフォーマンスを徹底的に評価します。
グループ回帰の場合、nuScenes データセットのクラスは、形状と普及率が類似した 6 つのグループに分割され、それぞれが専用のヘッドによって回帰されます。
提案された方法が多くの既存のトランスフォーマーベースの知覚アプローチに適用可能であり、潜在的な利点をもたらす可能性があることを示します。
クエリグループ回帰の動作は、統合された回帰ヘッドと比較して徹底的に分析されます。
クラススイッチングの動作と出力パラメータの分布の観点から。
提案された方法は、複数の仮説を深く追跡する方向など、さらなる研究のための多くの可能性を提供します。

要約(オリジナル)

Group regression is commonly used in 3D object detection to predict box parameters of similar classes in a joint head, aiming to benefit from similarities while separating highly dissimilar classes. For query-based perception methods, this has, so far, not been feasible. We close this gap and present a method to incorporate multi-class group regression, especially designed for the 3D domain in the context of autonomous driving, into existing attention and query-based perception approaches. We enhance a transformer based joint object detection and tracking model with this approach, and thoroughly evaluate its behavior and performance. For group regression, the classes of the nuScenes dataset are divided into six groups of similar shape and prevalence, each being regressed by a dedicated head. We show that the proposed method is applicable to many existing transformer based perception approaches and can bring potential benefits. The behavior of query group regression is thoroughly analyzed in comparison to a unified regression head, e.g. in terms of class-switching behavior and distribution of the output parameters. The proposed method offers many possibilities for further research, such as in the direction of deep multi-hypotheses tracking.

arxiv情報

著者 Felicia Ruppel,Florian Faion,Claudius Gläser,Klaus Dietmayer
発行日 2023-08-28 10:43:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク