要約
少数のショットの認識は、低データレジームの下で新しいカテゴリを認識することを目的としています。
最近のいくつかのショット認識方法は、補助的な意味モダリティ、つまりカテゴリ属性情報を表現学習に導入します。これにより、特徴の識別が強化され、認識パフォーマンスが向上します。
これらの既存のメソッドのほとんどは、クエリセットを無視して、サポートセットの属性情報のみを考慮しているため、パフォーマンスが低下する可能性があります。
この手紙では、クエリ属性の生成と数ショット認識のための識別視覚表現学習を共同で実行できる、新しい属性形状学習(ASL)フレームワークを提案します。
具体的には、クエリの属性を予測するために視覚属性予測子(VAP)が構築されます。
属性情報を活用することにより、属性視覚的注意モジュール(AVAM)が設計され、属性と視覚的表現を適応的に利用して、より識別力のある機能を学習できます。
属性モダリティのガイダンスの下で、私たちのメソッドは分類のための拡張されたセマンティック認識表現を学習できます。
実験は、私たちの方法がCUBとSUNのベンチマークで競争力のある結果を達成できることを示しています。
ソースコードは、\url{https://github.com/chenhaoxing/ASL}で入手できます。
要約(オリジナル)
Few-shot recognition aims to recognize novel categories under low-data regimes. Some recent few-shot recognition methods introduce auxiliary semantic modality, i.e., category attribute information, into representation learning, which enhances the feature discrimination and improves the recognition performance. Most of these existing methods only consider the attribute information of support set while ignoring the query set, resulting in a potential loss of performance. In this letter, we propose a novel attribute-shaped learning (ASL) framework, which can jointly perform query attributes generation and discriminative visual representation learning for few-shot recognition. Specifically, a visual-attribute predictor (VAP) is constructed to predict the attributes of queries. By leveraging the attributes information, an attribute-visual attention module (AVAM) is designed, which can adaptively utilize attributes and visual representations to learn more discriminative features. Under the guidance of attribute modality, our method can learn enhanced semantic-aware representation for classification. Experiments demonstrate that our method can achieve competitive results on CUB and SUN benchmarks. Our source code is available at: \url{https://github.com/chenhaoxing/ASL}.
arxiv情報
著者 | Haoxing Chen,Huaxiong Li,Yaohui Li,Chunlin Chen |
発行日 | 2022-06-05 09:00:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google