要約
オブジェクト検出のためのドメイン適応(DAOD)は、訓練されたモデルをソースからターゲットドメインに転送しようとしています。
さまざまなDAODメソッドが存在し、その一部は、さまざまなドメインの前景バックグラウンド関連の間のコンテキストバイアスを最小限に抑えることを目的としています。
ただし、適応中のバックグラウンド機能の変化と、コンテキストバイアスが異なるドメインでどのように表現されるかを分析することにより、DAODのコンテキストバイアスを研究していません。
私たちの研究実験は、DAODのコンテキストバイアスの潜在的な使いやすさを強調しています。
2つの異なる訓練されたモデルの異なる層、Detectron2とYolov11の異なる層にわたってさまざまな活性化値を変化させ、両方とも検出の数と質に影響を与える背景をマスキングすることにより、問題に対処します。
CarlaとVirtual Kittiの2つの合成データセットと、実際のオープンソースデータの2つの異なるバージョン、CityscapesとKittiセマンティックを、コンテキストバイアスを表現および定量化する別のドメインとして使用します。
最大平均不一致(MMD)や最大分散不一致(MVD)などのさまざまなメトリックを利用して、別々のドメインの操作された背景領域を与えられた前景の層固有の条件付き確率推定値を見つけます。
さらに、さまざまなデータセットの組み合わせにわたる前景帯域群の関連付けを分析します。
最先端のドメイン適応方法は、何らかの形のコンテキストバイアスを示し、潜在的に簡単な方法を適用して、コンテキストバイアスを緩和するための潜在的に簡単な方法を適用して、精度の向上を達成します(Cityscapesの51.207マップとCityScapesの検証の64.233マップの霧の検証の51.89から53.646マップ)。
詳細な分析を通じて、コンテキストバイアスの理解がDAODアプローチに影響し、前景機能の整合のみに焦点を当てることが効果的なDAODには不十分であることを実証します。
要約(オリジナル)
Domain adaptation for object detection (DAOD) seeks to transfer a trained model from a source to a target domain. Various DAOD methods exist, some of which aim to minimize context bias between foreground-background associations in various domains. However, no prior work has studied context bias in DAOD by analyzing changes in background features during adaptation and how context bias is represented in different domains. Our research experiment highlights the potential usability of context bias in DAOD. We address the problem by varying activation values over different layers of two different trained models, Detectron2 and YOLOv11, and by masking the background, both of which impact the number and quality of detections. We use two synthetic datasets, CARLA and Virtual KITTI, and two different versions of real open-source data, Cityscapes and KITTI semantic, as separate domains to represent and quantify context bias. We utilize different metrics such as Maximum Mean Discrepancy (MMD) and Maximum Variance Discrepancy (MVD) to find the layer-specific conditional probability estimates of foreground given manipulated background regions for separate domains. We further analyze foreground-background associations across various dataset combinations. We find that state-of-the-art domain adaptation methods exhibit some form of context bias and apply a potentially simple way to alleviate the context bias achieving improved accuracy (from 51.189 to 53.646 mAP on Cityscapes foggy validation with 63.207 mAP and 64.233 mAP on Cityscapes validation respectively). We demonstrate through detailed analysis that understanding of the context bias can affect DAOD approach and focusing solely on aligning foreground features is insufficient for effective DAOD.
arxiv情報
著者 | Hojun Son,Asma Almutairi,Arpan Kusari |
発行日 | 2025-05-19 15:50:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google