要約
この論文では、主に、口実タスク(回転や色の順列など)を通じて、数ショットの画像分類のための追加の特徴表現を学習する方法の問題に焦点を当てます。
口実タスクによって生成されるこの追加の知識は、人間が注釈を付けた監視(つまり、FSLタスクのクラスラベル)とは異なるため、数ショット学習(FSL)のパフォーマンスをさらに向上させることができます。
この問題を解決するために、プラグインの階層ツリー構造認識(HTS)メソッドを提示します。これは、FSLと口実タスクの関係を学習するだけでなく、さらに重要なことに、口実タスクによって生成された特徴表現を適応的に選択して集約し、最大化することができます。
FSLタスクのパフォーマンス。
階層ツリー構築コンポーネントとゲート選択集約コンポーネントを導入して、ツリー構造を構築し、いくつかのラベル付き画像を使用して新しいクラスに迅速に適応できる、より豊富な移転可能な知識を見つけます。
広範な実験により、HTSは複数のショット方式を大幅に強化して、4つのベンチマークデータセットで新しい最先端のパフォーマンスを実現できることが示されています。
コードはhttps://github.com/remiMZ/HTS-ECCV22で入手できます。
要約(オリジナル)
In this paper, we mainly focus on the problem of how to learn additional feature representations for few-shot image classification through pretext tasks (e.g., rotation or color permutation and so on). This additional knowledge generated by pretext tasks can further improve the performance of few-shot learning (FSL) as it differs from human-annotated supervision (i.e., class labels of FSL tasks). To solve this problem, we present a plug-in Hierarchical Tree Structure-aware (HTS) method, which not only learns the relationship of FSL and pretext tasks, but more importantly, can adaptively select and aggregate feature representations generated by pretext tasks to maximize the performance of FSL tasks. A hierarchical tree constructing component and a gated selection aggregating component is introduced to construct the tree structure and find richer transferable knowledge that can rapidly adapt to novel classes with a few labeled images. Extensive experiments show that our HTS can significantly enhance multiple few-shot methods to achieve new state-of-the-art performance on four benchmark datasets. The code is available at: https://github.com/remiMZ/HTS-ECCV22.
arxiv情報
著者 | Min Zhang,Siteng Huang,Wenbin Li,Donglin Wang |
発行日 | 2022-07-14 15:17:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google