要約
現実世界から収集されたデータは通常、長い裾の分布を示し、頻繁に使用されるクラスには豊富なデータが含まれますが、まれなクラスには限られた数のサンプルしか含まれません。
このようなデータの不均衡に対処するために既存の教師あり学習アプローチが提案されていますが、ラベル監視の要件により、ラベルの注釈が利用できない可能性がある現実世界のシナリオへの適用が制限されてしまいます。
この論文では、クラス ラベルや関連するクラス頻度にアクセスせずに、周波数認識自己教師あり学習 (FASSL) を提案します。
固有のロングテール分布を持つラベルなしデータからの学習をターゲットとする FASSL の目標は、下流の分類タスク用の識別的な特徴表現を生成することです。
FASSL では、まず、関連するロングテール分布を反映する、周波数を意識したプロトタイプを学習します。
特にレアクラスのサンプルに焦点を当て、導入された自己教師あり学習スキームを使用して、画像データと派生プロトタイプ間の関係がさらに活用されます。
ロングテール画像データセットの実験により、学習スキームの有効性が定量的および定性的に検証されます。
要約(オリジナル)
Data collected from the real world typically exhibit long-tailed distributions, where frequent classes contain abundant data while rare ones have only a limited number of samples. While existing supervised learning approaches have been proposed to tackle such data imbalance, the requirement of label supervision would limit their applicability to real-world scenarios in which label annotation might not be available. Without the access to class labels nor the associated class frequencies, we propose Frequency-Aware Self-Supervised Learning (FASSL) in this paper. Targeting at learning from unlabeled data with inherent long-tailed distributions, the goal of FASSL is to produce discriminative feature representations for downstream classification tasks. In FASSL, we first learn frequency-aware prototypes, reflecting the associated long-tailed distribution. Particularly focusing on rare-class samples, the relationships between image data and the derived prototypes are further exploited with the introduced self-supervised learning scheme. Experiments on long-tailed image datasets quantitatively and qualitatively verify the effectiveness of our learning scheme.
arxiv情報
著者 | Ci-Siang Lin,Min-Hung Chen,Yu-Chiang Frank Wang |
発行日 | 2023-09-15 12:46:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google