Curvature-Balanced Feature Manifold Learning for Long-Tailed Classification

要約

ロングテール分類の課題に対処するために、研究者はモデルのバイアスを軽減するためのいくつかのアプローチを提案しましたが、そのほとんどはサンプルが少ないクラスが弱いクラスであると想定しています。
ただし、最近の研究では、末尾クラスの学習が必ずしも難しいわけではないことが示されており、サンプルバランスされたデータセットでモデルのバイアスが観察されており、モデルのバイアスに影響を与える他の要因の存在が示唆されています。
この研究では、ディープ ニューラル ネットワークにおける知覚多様体の一連の幾何学的測定を体系的に提案し、分類の難易度に対する知覚多様体の幾何学的特性の影響と、学習によって知覚多様体の幾何学的特性がどのように形成されるかを調査します。
予期せぬ発見は、クラス精度と知覚多様体の分離度の間の相関がトレーニング中に徐々に減少する一方で、曲率との負の相関が徐々に増加することであり、曲率の不均衡がモデルのバイアスにつながることを示唆しています。
したがって、曲率のバランスがとれた、より平坦な知覚多様体をモデルが学習しやすくするために、曲率の正則化を提案します。
複数のロングテールデータセットと非ロングテールデータセットの評価では、特に現在の最先端技術に基づいて大幅なパフォーマンス向上を達成する際に、私たちのアプローチの優れたパフォーマンスと刺激的な汎用性が示されています。
私たちの研究は、モデルの偏りに関する幾何学的解析の視点を開き、研究者に非ロングテールデータセットやサンプルバランスの取れたデータセットにおけるモデルの偏りに注意を払うよう思い出させます。
コードとモデルは公開されます。

要約(オリジナル)

To address the challenges of long-tailed classification, researchers have proposed several approaches to reduce model bias, most of which assume that classes with few samples are weak classes. However, recent studies have shown that tail classes are not always hard to learn, and model bias has been observed on sample-balanced datasets, suggesting the existence of other factors that affect model bias. In this work, we systematically propose a series of geometric measurements for perceptual manifolds in deep neural networks, and then explore the effect of the geometric characteristics of perceptual manifolds on classification difficulty and how learning shapes the geometric characteristics of perceptual manifolds. An unanticipated finding is that the correlation between the class accuracy and the separation degree of perceptual manifolds gradually decreases during training, while the negative correlation with the curvature gradually increases, implying that curvature imbalance leads to model bias. Therefore, we propose curvature regularization to facilitate the model to learn curvature-balanced and flatter perceptual manifolds. Evaluations on multiple long-tailed and non-long-tailed datasets show the excellent performance and exciting generality of our approach, especially in achieving significant performance improvements based on current state-of-the-art techniques. Our work opens up a geometric analysis perspective on model bias and reminds researchers to pay attention to model bias on non-long-tailed and even sample-balanced datasets. The code and model will be made public.

arxiv情報

著者 Yanbiao Ma,Licheng Jiao,Fang Liu,Shuyuan Yang,Xu Liu,Lingling Li
発行日 2024-01-18 14:15:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク