Effective Dual-Region Augmentation for Reduced Reliance on Large Amounts of Labeled Data

要約

このペーパーでは、大規模なラベル付きデータセットへの依存を減らし、ソースフリードメイン適応(SFDA)や個人の再識別(REID)を含む多様なコンピュータービジョンタスク全体でモデルの堅牢性と適応性を改善するように設計された新しいデュアルレジオン増強アプローチを紹介します。
この方法は、ランダムノイズの摂動を前景オブジェクトに適用し、背景パッチを空間的にシャッフルすることにより、ターゲットデータ変換を実行します。
これにより、トレーニングデータの多様性が効果的に向上し、モデルの堅牢性と一般化が改善されます。
SFDAのPACSデータセットの評価は、当社の増強戦略が既存の方法を常に上回り、シングルターゲットとマルチターゲットの両方の適応設定の両方で大幅な精度の向上を達成することを示しています。
構造化された変換を通じてトレーニングデータを増強することにより、この方法により、ドメイン全体でモデルの一般化が可能になり、手動で注釈されたデータセットへの依存を減らすためのスケーラブルなソリューションが提供されます。
さらに、Market-1501およびDukemtmc-reidデータセットでの実験は、従来の増強技術を上回る人のアプローチの有効性を検証します。

要約(オリジナル)

This paper introduces a novel dual-region augmentation approach designed to reduce reliance on large-scale labeled datasets while improving model robustness and adaptability across diverse computer vision tasks, including source-free domain adaptation (SFDA) and person re-identification (ReID). Our method performs targeted data transformations by applying random noise perturbations to foreground objects and spatially shuffling background patches. This effectively increases the diversity of the training data, improving model robustness and generalization. Evaluations on the PACS dataset for SFDA demonstrate that our augmentation strategy consistently outperforms existing methods, achieving significant accuracy improvements in both single-target and multi-target adaptation settings. By augmenting training data through structured transformations, our method enables model generalization across domains, providing a scalable solution for reducing reliance on manually annotated datasets. Furthermore, experiments on Market-1501 and DukeMTMC-reID datasets validate the effectiveness of our approach for person ReID, surpassing traditional augmentation techniques.

arxiv情報

著者 Prasanna Reddy Pulakurthi,Majid Rabbani,Celso M. de Melo,Sohail A. Dianat,Raghuveer M. Rao
発行日 2025-04-17 16:42:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク