MS3D: Leveraging Multiple Detectors for Unsupervised Domain Adaptation in 3D Object Detection

要約

【タイトル】3D物体検出における教師なしドメイン適応のための複数の検出器を活用するMS3D

【要約】
– MS3Dは、3D物体検出における教師なしドメイン適応のための新しい自己トレーニングパイプラインである。
– 3D検出器の精度は優れているが、特定のドメインバイアスに過剰適合し、さまざまなセンサーセットアップや環境でサブオプティマルなパフォーマンスを示すことがある。
– 既存の方法は、単一の検出器を対象ドメインに適応させることに焦点を当てており、異なる検出器が異なる未知のドメインにおいて独自の専門知識を持っていることを見落としている。MS3Dはこれを活用して、複数のソースドメインから異なる事前トレーニング済み検出器を組み合わせ、時間情報を取り込んで高品質な疑似ラベルを生成する。
– KDE Box Fusionメソッドは、複数のドメインからボックス提案を結合して擬似ラベルを生成し、最高のソースドメイン検出器を超える性能を発揮する。
– MS3Dはドメインシフトへの強い頑健性を持ち、より遠い距離で正確な疑似ラベルを生成するため、高-低ビームのドメイン適応およびその逆に適している。
– MS3Dは、すべての評価データセットで最先端の性能を発揮し、事前トレーニング済みソース検出器の選択が自己トレーニングの結果にほとんど影響を与えないことを示し、実世界のアプリケーションに適している。

要約(オリジナル)

We introduce Multi-Source 3D (MS3D), a new self-training pipeline for unsupervised domain adaptation in 3D object detection. Despite the remarkable accuracy of 3D detectors, they often overfit to specific domain biases, leading to suboptimal performance in various sensor setups and environments. Existing methods typically focus on adapting a single detector to the target domain, overlooking the fact that different detectors possess distinct expertise on different unseen domains. MS3D leverages this by combining different pre-trained detectors from multiple source domains and incorporating temporal information to produce high-quality pseudo-labels for fine-tuning. Our proposed Kernel-Density Estimation (KDE) Box Fusion method fuses box proposals from multiple domains to obtain pseudo-labels that surpass the performance of the best source domain detectors. MS3D exhibits greater robustness to domain shifts and produces accurate pseudo-labels over greater distances, making it well-suited for high-to-low beam domain adaptation and vice versa. Our method achieved state-of-the-art performance on all evaluated datasets, and we demonstrate that the choice of pre-trained source detectors has minimal impact on the self-training result, making MS3D suitable for real-world applications.

arxiv情報

著者 Darren Tsai,Julie Stephany Berrio,Mao Shan,Eduardo Nebot,Stewart Worrall
発行日 2023-04-10 07:17:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク