CORL: Compositional Representation Learning for Few-Shot Classification


少数ショット画像分類は、2 つの連続した学習プロセスで構成されます。1) メタ学習段階では、モデルは一連のトレーニング クラスから知識ベースを取得します。
2) メタテスト中に、獲得した知識を使用して、非常に少数の例から見えないクラスを認識します。
人間のオブジェクトの構成表現に着想を得て、共有コンポーネントとその空間構成の辞書としてオブジェクトを明示的に表現するニューラル ネットワーク アーキテクチャをトレーニングします。
両方の辞書の要素は、トレーニング クラス間で共有されます。
メタテスト中、見えないクラスの表現は、コンポーネント表現とナレッジ ベースからのコンポーネント アクティベーション マップを使用して学習されます。
miniImageNet、tieredImageNet、CIFAR-FS、および FC100 を使用した少数ショット分類のための解釈可能な合成学習フレームワークの価値を実証し、同等のパフォーマンスを達成します。


Few-shot image classification consists of two consecutive learning processes: 1) In the meta-learning stage, the model acquires a knowledge base from a set of training classes. 2) During meta-testing, the acquired knowledge is used to recognize unseen classes from very few examples. Inspired by the compositional representation of objects in humans, we train a neural network architecture that explicitly represents objects as a dictionary of shared components and their spatial composition. In particular, during meta-learning, we train a knowledge base that consists of a dictionary of component representations and a dictionary of component activation maps that encode common spatial activation patterns of components. The elements of both dictionaries are shared among the training classes. During meta-testing, the representation of unseen classes is learned using the component representations and the component activation maps from the knowledge base. Finally, an attention mechanism is used to strengthen those components that are most important for each category. We demonstrate the value of our interpretable compositional learning framework for a few-shot classification using miniImageNet, tieredImageNet, CIFAR-FS, and FC100, where we achieve comparable performance.


著者 Ju He,Adam Kortylewski,Alan Yuille
発行日 2022-12-16 18:45:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク