KeepOriginalAugment: Single Image-based Better Information-Preserving Data Augmentation Approach

要約

高度な画像データ拡張技術は、さまざまなコンピューター ビジョン タスクのモデルのトレーニングを強化する上で極めて重要な役割を果たします。
特に、SalfMix と KeepAugment が人気の戦略として浮上し、モデルのパフォーマンスを向上させる効果を示しています。
ただし、SalfMix は顕著な特徴の複製に依存しているため、過剰適合のリスクが生じ、モデルの汎化機能が損なわれる可能性があります。
逆に、顕著な領域を選択的に保存し、顕著でない領域を拡張する KeepAugment は、重要なコンテキスト情報の交換を妨げるドメイン シフトを導入し、モデル全体の理解を妨げます。
これらの課題に応えて、新しいデータ拡張アプローチである KeepOriginalAugment を紹介します。
この方法では、非顕著領域内に最も顕著な領域がインテリジェントに組み込まれ、どちらの領域にも拡張を適用できるようになります。
KeepOriginalAugment は、データの多様性と情報の保存の間のバランスをとり、モデルが多様な顕著領域と非顕著領域の両方を活用できるようにし、パフォーマンスの向上につながります。
顕著な領域の最小、最大、またはランダムの配置を決定するための 3 つの戦略を検討し、どの部分 (顕著または非顕著) が拡張されるかを決定するための視点の交換戦略を調査します。
CIFAR-10、CIFAR-100、TinyImageNet などの分類データセットに対して行われた実験評価では、既存の最先端技術と比較して KeepOriginalAugment のパフォーマンスが優れていることが実証されました。

要約(オリジナル)

Advanced image data augmentation techniques play a pivotal role in enhancing the training of models for diverse computer vision tasks. Notably, SalfMix and KeepAugment have emerged as popular strategies, showcasing their efficacy in boosting model performance. However, SalfMix reliance on duplicating salient features poses a risk of overfitting, potentially compromising the model’s generalization capabilities. Conversely, KeepAugment, which selectively preserves salient regions and augments non-salient ones, introduces a domain shift that hinders the exchange of crucial contextual information, impeding overall model understanding. In response to these challenges, we introduce KeepOriginalAugment, a novel data augmentation approach. This method intelligently incorporates the most salient region within the non-salient area, allowing augmentation to be applied to either region. Striking a balance between data diversity and information preservation, KeepOriginalAugment enables models to leverage both diverse salient and non-salient regions, leading to enhanced performance. We explore three strategies for determining the placement of the salient region minimum, maximum, or random and investigate swapping perspective strategies to decide which part (salient or non-salient) undergoes augmentation. Our experimental evaluations, conducted on classification datasets such as CIFAR-10, CIFAR-100, and TinyImageNet, demonstrate the superior performance of KeepOriginalAugment compared to existing state-of-the-art techniques.

arxiv情報

著者 Teerath Kumar,Alessandra Mileo,Malika Bendechache
発行日 2024-05-10 09:37:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク