Long-tailed Recognition by Learning from Latent Categories

要約

この作業では、ロングテール画像認識の挑戦的なタスクに取り組みます。
以前のロングテール認識方法は、通常、モデルのトレーニング中にテール クラスにより注意を向けるために、テール クラスのデータ拡張またはリバランス戦略に焦点を当てていました。
ただし、尾部クラスのトレーニング画像が限られているため、尾部クラス画像の多様性は依然として制限されており、その結果、特徴表現が不十分になります。
この作業では、頭と尾のクラス間で共通の潜在的な機能を使用して、より良い機能表現を提供できるという仮説を立てています。
これに動機付けられて、潜在カテゴリベースのロングテール認識 (LCReg) メソッドを導入します。
具体的には、頭と尾のクラス間で共有される一連のクラスに依存しない潜在的な機能を学習することを提案します。
次に、潜在的な特徴にセマンティック データ拡張を適用することで、トレーニング サンプルの多様性を暗黙的に強化します。
5 つのロングテール画像認識データセットに関する広範な実験により、提案した LCReg が以前の方法を大幅に上回り、最先端の結果を達成できることが実証されました。

要約(オリジナル)

In this work, we address the challenging task of long-tailed image recognition. Previous long-tailed recognition methods commonly focus on the data augmentation or re-balancing strategy of the tail classes to give more attention to tail classes during the model training. However, due to the limited training images for tail classes, the diversity of tail class images is still restricted, which results in poor feature representations. In this work, we hypothesize that common latent features among the head and tail classes can be used to give better feature representation. Motivated by this, we introduce a Latent Categories based long-tail Recognition (LCReg) method. Specifically, we propose to learn a set of class-agnostic latent features shared among the head and tail classes. Then, we implicitly enrich the training sample diversity via applying semantic data augmentation to the latent features. Extensive experiments on five long-tailed image recognition datasets demonstrate that our proposed LCReg is able to significantly outperform previous methods and achieve state-of-the-art results.

arxiv情報

著者 Weide Liu,Zhonghua Wu,Yiming Wang,Henghui Ding,Fayao Liu,Jie Lin,Guosheng Lin
発行日 2022-08-02 07:27:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク