SUMix: Mixup with Semantic and Uncertain Information

要約

ディープニューラルネットワークの汎化能力を向上させるために、ミックスアップデータ補強アプローチがディープラーニングの様々なタスクに適用されている。既存のCutMixやSaliencyMixなどのアプローチでは、ある画像のパッチを別の画像のパッチとランダムに置き換えて混合画像を生成する。同様に、対応するラベルは固定比率$llambda$ by lで線形結合される。2つの画像のオブジェクトは混合処理中に重なる可能性があるため、混合サンプルには意味情報が破損している。この場合、混合画像は混合ラベル情報と一致しない。その上、このようなラベルはディープラーニングモデルの学習をミスリードする可能性があり、その結果パフォーマンスが低下する。この問題を解決するために、我々はSUMixと名付けた新しいアプローチを提案し、学習プロセス中に混合サンプルの混合比率と不確実性を学習する。まず、学習可能な類似関数を設計し、正確な混合比を計算する。第二に、混合サンプルの不確実性をモデル化するための正則化項としてのアプローチを検討する。我々は5つの画像ベンチマークで実験を行い、広範な実験結果は、我々の手法が、異なる切断ベースの混合アプローチを持つ分類器の性能を向上させることが可能であることを示唆する。ソースコードはhttps://github.com/JinXins/SUMix。

要約(オリジナル)

Mixup data augmentation approaches have been applied for various tasks of deep learning to improve the generalization ability of deep neural networks. Some existing approaches CutMix, SaliencyMix, etc. randomly replace a patch in one image with patches from another to generate the mixed image. Similarly, the corresponding labels are linearly combined by a fixed ratio $\lambda$ by l. The objects in two images may be overlapped during the mixing process, so some semantic information is corrupted in the mixed samples. In this case, the mixed image does not match the mixed label information. Besides, such a label may mislead the deep learning model training, which results in poor performance. To solve this problem, we proposed a novel approach named SUMix to learn the mixing ratio as well as the uncertainty for the mixed samples during the training process. First, we design a learnable similarity function to compute an accurate mix ratio. Second, an approach is investigated as a regularized term to model the uncertainty of the mixed samples. We conduct experiments on five image benchmarks, and extensive experimental results imply that our method is capable of improving the performance of classifiers with different cutting-based mixup approaches. The source code is available at https://github.com/JinXins/SUMix.

arxiv情報

著者 Huafeng Qin,Xin Jin,Hongyu Zhu,Hongchao Liao,Mounîm A. El-Yacoubi,Xinbo Gao
発行日 2024-09-03 10:46:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク