Robust Long-Tailed Learning via Label-Aware Bounded CVaR

要約

現実世界の分類問題のデータは常に不均衡またはロングテールであり、多数派のクラスがモデルのトレーニングを支配するサンプルの大部分を持っています。
このような設定では、単純なモデルは少数派のクラスではパフォーマンスが低下する傾向があります。
これまで、ロングテール傾き問題に対処するためにさまざまな損失修正が提案されてきましたが、これらの方法は同じクラスのサンプルを無差別に扱うか、理論的な保証がありません。
この論文では、確固たる理論的根拠に基づいてロングテール学習のパフォーマンスを向上させる、CVaR (Conditional Value at Risk) に基づく 2 つの新しいアプローチを提案します。
具体的には、最初にラベル認識境界 CVaR (LAB-CVaR) 損失を導入して、元の CVaR の悲観的な結果を克服し、さらに LAB-CVaR の最適な重み境界を理論的に設計します。
LAB-CVaR に基づいて、最適化プロセスを安定させるためにロジット調整 (LAB-CVaR-logit) 損失を伴う LAB-CVaR をさらに提案し、理論的なサポートも提供します。
ロングテールラベル分布を備えた現実世界のデータセットに対する広範な実験により、提案した手法の優位性が検証されています。

要約(オリジナル)

Data in the real-world classification problems are always imbalanced or long-tailed, wherein the majority classes have the most of the samples that dominate the model training. In such setting, the naive model tends to have poor performance on the minority classes. Previously, a variety of loss modifications have been proposed to address the long-tailed leaning problem, while these methods either treat the samples in the same class indiscriminatingly or lack a theoretical guarantee. In this paper, we propose two novel approaches based on CVaR (Conditional Value at Risk) to improve the performance of long-tailed learning with a solid theoretical ground. Specifically, we firstly introduce a Label-Aware Bounded CVaR (LAB-CVaR) loss to overcome the pessimistic result of the original CVaR, and further design the optimal weight bounds for LAB-CVaR theoretically. Based on LAB-CVaR, we additionally propose a LAB-CVaR with logit adjustment (LAB-CVaR-logit) loss to stabilize the optimization process, where we also offer the theoretical support. Extensive experiments on real-world datasets with long-tailed label distributions verify the superiority of our proposed methods.

arxiv情報

著者 Hong Zhu,Runpeng Yu,Xing Tang,Yifei Wang,Yuan Fang,Yisen Wang
発行日 2023-08-29 16:07:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.IR, cs.LG パーマリンク