SUMix: Mixup with Semantic and Uncertain Information

要約

ミックスアップ データ拡張アプローチは、ディープ ニューラル ネットワークの一般化能力を向上させるために、ディープ ラーニングのさまざまなタスクに適用されています。
CutMix、SaliencyMix などの既存のアプローチでは、ある画像のパッチを別の画像のパッチにランダムに置き換えて、混合画像を生成します。
同様に、対応するラベルは、固定比率 $\lambda$ by l で線形に結合されます。
2 つの画像内のオブジェクトは混合プロセス中に重なる可能性があるため、混合されたサンプルでは一部の意味情報が破損します。
この場合、混合画像と混合ラベル情報は一致しない。
さらに、そのようなラベルは深層学習モデルのトレーニングを誤解させる可能性があり、その結果、パフォーマンスが低下します。
この問題を解決するために、トレーニング プロセス中に混合サンプルの不確実性だけでなく混合比を学習するための SUMix という新しいアプローチを提案しました。
まず、正確な混合比を計算するための学習可能な類似度関数を設計します。
第 2 に、混合サンプルの不確実性をモデル化するための正規化された項としてアプローチが調査されます。
私たちは 5 つの画像ベンチマークで実験を行い、広範な実験結果は、私たちの方法がさまざまなカットベースの混合アプローチで分類器のパフォーマンスを向上できることを示唆しています。
ソース コードは https://github.com/JinXins/SUMix で入手できます。

要約(オリジナル)

Mixup data augmentation approaches have been applied for various tasks of deep learning to improve the generalization ability of deep neural networks. Some existing approaches CutMix, SaliencyMix, etc. randomly replace a patch in one image with patches from another to generate the mixed image. Similarly, the corresponding labels are linearly combined by a fixed ratio $\lambda$ by l. The objects in two images may be overlapped during the mixing process, so some semantic information is corrupted in the mixed samples. In this case, the mixed image does not match the mixed label information. Besides, such a label may mislead the deep learning model training, which results in poor performance. To solve this problem, we proposed a novel approach named SUMix to learn the mixing ratio as well as the uncertainty for the mixed samples during the training process. First, we design a learnable similarity function to compute an accurate mix ratio. Second, an approach is investigated as a regularized term to model the uncertainty of the mixed samples. We conduct experiments on five image benchmarks, and extensive experimental results imply that our method is capable of improving the performance of classifiers with different cutting-based mixup approaches. The source code is available at https://github.com/JinXins/SUMix.

arxiv情報

著者 Huafeng Qin,Xin Jin,Hongyu Zhu,Hongchao Liao,Mounîm A. El-Yacoubi,Xinbo Gao
発行日 2024-07-10 16:25:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク