MS3D: Leveraging Multiple Detectors for Unsupervised Domain Adaptation in 3D Object Detection

要約

タイトル:MS3D:3Dオブジェクト検出の非監視ドメイン適応のための複数のディテクターを活用する

要約:

– 3Dオブジェクト検出の精度は非常に高いが、特定のドメインバイアスに過剰に適合するため、さまざまなセンサーセットアップや環境での最適なパフォーマンスが得られないことがある。
– 既存の方法は通常、単一のディテクタをターゲットドメインに適応させることに重点を置いており、異なるディテクタには未知のドメインに対する異なる専門知識があるという点を見落としている。
– MS3Dは、複数のソースドメインから異なる事前トレーニングされた検出器を組み合わせ、時間情報を組み込んで高品質な疑似ラベルを生成することでこれを活用する。提案されたKernel-Density Estimation (KDE) Box Fusion方法は、複数のドメインからのボックス提案を融合して、最も優れたソースドメインディテクタを超える性能の疑似ラベルを得る。
– MS3Dはドメインシフトに対してより強靭であり、大きな距離でも正確な疑似ラベルを生成するため、高から低のビームドメイン適応やその逆に適している。
– 本手法は評価されたすべてのデータセットで最先端のパフォーマンスを発揮し、事前にトレーニングされたソースディテクタの選択が自己訓練結果にほとんど影響を与えないことを示し、実世界のアプリケーションに適している。

要約(オリジナル)

We introduce Multi-Source 3D (MS3D), a new self-training pipeline for unsupervised domain adaptation in 3D object detection. Despite the remarkable accuracy of 3D detectors, they often overfit to specific domain biases, leading to suboptimal performance in various sensor setups and environments. Existing methods typically focus on adapting a single detector to the target domain, overlooking the fact that different detectors possess distinct expertise on different unseen domains. MS3D leverages this by combining different pre-trained detectors from multiple source domains and incorporating temporal information to produce high-quality pseudo-labels for fine-tuning. Our proposed Kernel-Density Estimation (KDE) Box Fusion method fuses box proposals from multiple domains to obtain pseudo-labels that surpass the performance of the best source domain detectors. MS3D exhibits greater robustness to domain shifts and produces accurate pseudo-labels over greater distances, making it well-suited for high-to-low beam domain adaptation and vice versa. Our method achieved state-of-the-art performance on all evaluated datasets, and we demonstrate that the choice of pre-trained source detectors has minimal impact on the self-training result, making MS3D suitable for real-world applications.

arxiv情報

著者 Darren Tsai,Julie Stephany Berrio,Mao Shan,Eduardo Nebot,Stewart Worrall
発行日 2023-04-05 13:29:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク