A review of ensemble learning and data augmentation models for class imbalanced problems: combination, implementation and evaluation



– クラス不均衡(CI)は、1つのクラスに属する観測値の数が他のクラスよりも低い場合に分類の問題が発生する。
– 複数のモデルを組み合わせて頑健なモデルを得るアンサンブル学習は、データ増強方法と共に不均衡クラス問題に対処するために広く使用されている。
– 過去10年間で、新しい方法(生成的敵対的ネットワークなど)を含め、アンサンブル学習とデータ増強方法を向上させるために多くの戦略が追加されてきた。
– この論文では、主要なベンチマークCI問題を解決するために使用されるデータ増強とアンサンブル学習方法を評価する計算検証を提供する。
– CI問題の分類性能を向上させるための最も効果的な組み合わせを特定するために、10のデータ増強と10のアンサンブル学習方法を評価する一般的なフレームワークを提案する。
– 結果は、データ増強方法とアンサンブル学習の組み合わせが、不均衡なデータセットにおける分類性能を有意に改善することを示している。
– これらの知見は、機械学習アプリケーションにおける不均衡なデータセットの処理に対するより効果的なアプローチの開発に重要な示唆を提供する。


Class imbalance (CI) in classification problems arises when the number of observations belonging to one class is lower than the other classes. Ensemble learning that combines multiple models to obtain a robust model has been prominently used with data augmentation methods to address class imbalance problems. In the last decade, a number of strategies have been added to enhance ensemble learning and data augmentation methods, along with new methods such as generative adversarial networks (GANs). A combination of these has been applied in many studies, but the true rank of different combinations would require a computational review. In this paper, we present a computational review to evaluate data augmentation and ensemble learning methods used to address prominent benchmark CI problems. We propose a general framework that evaluates 10 data augmentation and 10 ensemble learning methods for CI problems. Our objective was to identify the most effective combination for improving classification performance on imbalanced datasets. The results indicate that combinations of data augmentation methods with ensemble learning can significantly improve classification performance on imbalanced datasets. These findings have important implications for the development of more effective approaches for handling imbalanced datasets in machine learning applications.


著者 Azal Ahmad Khan,Omkar Chaudhari,Rohitash Chandra
発行日 2023-04-06 04:37:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク