Out-of-Distribution Detection in Long-Tailed Recognition with Calibrated Outlier Class Learning

要約

既存の分布外 (OOD) 手法は、バランスの取れたデータセットでは大きな成功を収めていますが、1) OOD サンプルが誤ってヘッド クラスおよび/または 2) テールクラス サンプルに分類されることが多いロングテール認識 (LTR) シナリオでは無効になります。
OOD サンプルとして扱われます。
これらの問題に対処するために、現在の研究では、補助/疑似 OOD データの事前分布をロングテール分布内 (ID) データに適合させています。
ただし、実際の OOD サンプルが不明であり、LTR のクラスの不均衡が大きいため、そのような正確な事前分布を取得することは困難です。
この事前要件を回避する簡単な解決策は、OOD サンプルをカプセル化する外れ値クラスを学習することです。
主な課題は、外れ値クラスを学習する際の OOD サンプルとヘッド/テールクラス サンプルの間の前述の混乱に取り組むことです。
この目的を達成するために、新しい校正外れ値クラス学習 (COCL) アプローチを導入します。このアプローチでは、1) 表現空間の先頭クラスと末尾クラスの両方から OOD サンプルを区別するために、外れ値クラス学習にバイアスを除去した大きなマージン学習方法が導入されます。2)
) 外れ値クラスを認識したロジット校正方法は、ロングテール分類の信頼性を高めるために定義されています。
3 つの一般的なベンチマーク CIFAR10-LT、CIFAR100-LT、ImageNet-LT に関する広範な実証結果は、COCL が ID データの分類精度を向上させながら、LTR における最先端の OOD 検出方法を大幅に上回っていることを実証しています。
コードは https://github.com/mala-lab/COCL で入手できます。

要約(オリジナル)

Existing out-of-distribution (OOD) methods have shown great success on balanced datasets but become ineffective in long-tailed recognition (LTR) scenarios where 1) OOD samples are often wrongly classified into head classes and/or 2) tail-class samples are treated as OOD samples. To address these issues, current studies fit a prior distribution of auxiliary/pseudo OOD data to the long-tailed in-distribution (ID) data. However, it is difficult to obtain such an accurate prior distribution given the unknowingness of real OOD samples and heavy class imbalance in LTR. A straightforward solution to avoid the requirement of this prior is to learn an outlier class to encapsulate the OOD samples. The main challenge is then to tackle the aforementioned confusion between OOD samples and head/tail-class samples when learning the outlier class. To this end, we introduce a novel calibrated outlier class learning (COCL) approach, in which 1) a debiased large margin learning method is introduced in the outlier class learning to distinguish OOD samples from both head and tail classes in the representation space and 2) an outlier-class-aware logit calibration method is defined to enhance the long-tailed classification confidence. Extensive empirical results on three popular benchmarks CIFAR10-LT, CIFAR100-LT, and ImageNet-LT demonstrate that COCL substantially outperforms state-of-the-art OOD detection methods in LTR while being able to improve the classification accuracy on ID data. Code is available at https://github.com/mala-lab/COCL.

arxiv情報

著者 Wenjun Miao,Guansong Pang,Tianqi Li,Xiao Bai,Jin Zheng
発行日 2023-12-19 07:49:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク