要約
ディープラーニングを用いた物体認識において、認識精度を向上させるためにはデータ拡張が不可欠な技術です。
mixup など、複数のデータセットから混合データを生成する手法は、学習データにはない新たな多様性を獲得できるため、精度向上に大きく貢献します。
ただし、混合のために選択されるデータは、トレーニング プロセス全体でランダムにサンプリングされるため、適切なクラスまたはデータが選択されない場合があります。
本研究では、クラス確率に基づいてクラス間の距離を計算し、トレーニングプロセスで混合する適切なクラスからデータを選択できるデータ拡張方法を提案します。
混合データは、トレーニングを容易にするために、各クラスのトレーニング傾向に従って動的に調整されます。
提案した方法は、混合データを生成するための従来の方法と組み合わせて適用される。
評価実験は、提案された方法が一般的およびロングテール画像認識データセットの認識性能を改善することを示しています。
要約(オリジナル)
Data augmentation is an essential technique for improving recognition accuracy in object recognition using deep learning. Methods that generate mixed data from multiple data sets, such as mixup, can acquire new diversity that is not included in the training data, and thus contribute significantly to accuracy improvement. However, since the data selected for mixing are randomly sampled throughout the training process, there are cases where appropriate classes or data are not selected. In this study, we propose a data augmentation method that calculates the distance between classes based on class probabilities and can select data from suitable classes to be mixed in the training process. Mixture data is dynamically adjusted according to the training trend of each class to facilitate training. The proposed method is applied in combination with conventional methods for generating mixed data. Evaluation experiments show that the proposed method improves recognition performance on general and long-tailed image recognition datasets.
arxiv情報
著者 | Shungo Fujii,Yasunori Ishii,Kazuki Kozuka,Tsubasa Hirakawa,Takayoshi Yamashita,Hironobu Fujiyoshi |
発行日 | 2022-09-12 10:10:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google