Survey on Imbalanced Data, Representation Learning and SEP Forecasting

要約

深層学習手法により、回帰、分類、予測などのさまざまなデータ駆動型タスクが大幅に進歩しました。
ただし、この進歩の多くは、トレーニング データセットがそれに含まれるターゲットに関してバランスが取れているという、強力ではあるが非現実的な仮定に基づいています。
データの不均衡が頻繁に起こる現実世界の状況との不整合により、実際のアプリケーションにおけるそのようなモデルの有効性が妨げられます。
その前提を再考し、現実世界の不均衡に対処する方法が出現し始め、この課題に対処する道を模索し始めています。
そのような有望な手段の 1 つは表現学習です。これにより、モデルが複雑なデータ特性を捕捉し、少数派のクラスに対してより適切に一般化できるようになります。
これらの手法は、特徴空間のより豊富な表現に焦点を当てることにより、データの不均衡の影響を軽減する可能性を秘めています。
この調査では、現実世界の不均衡をより適切に近似するために表現学習などの戦略を採用し、均衡データの仮定から一歩踏み出した深層学習の成果を紹介します。
また、データの不均衡に対処することが成功のために最も重要である SEP 予測における重要なアプリケーションにも焦点を当てます。

要約(オリジナル)

Deep Learning methods have significantly advanced various data-driven tasks such as regression, classification, and forecasting. However, much of this progress has been predicated on the strong but often unrealistic assumption that training datasets are balanced with respect to the targets they contain. This misalignment with real-world conditions, where data is frequently imbalanced, hampers the effectiveness of such models in practical applications. Methods that reconsider that assumption and tackle real-world imbalances have begun to emerge and explore avenues to address this challenge. One such promising avenue is representation learning, which enables models to capture complex data characteristics and generalize better to minority classes. By focusing on a richer representation of the feature space, these techniques hold the potential to mitigate the impact of data imbalance. In this survey, we present deep learning works that step away from the balanced-data assumption, employing strategies like representation learning to better approximate real-world imbalances. We also highlight a critical application in SEP forecasting where addressing data imbalance is paramount for success.

arxiv情報

著者 Josias Moukpe
発行日 2023-10-11 15:38:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク