CHIP: Contrastive Hierarchical Image Pretraining

要約

少数ショットオブジェクト分類は、限られた数の例を監視として画像内のオブジェクトを分類するタスクです。
我々は、目に見えないクラスのオブジェクトを階層ベースの分類で比較的一般的なカテゴリに分類できるワンショット/フューショット分類モデルを提案します。
私たちのモデルは、トレーニング段階では使用されない、画像埋め込みから抽出された特徴に基づいてオブジェクトを分類するために、3 レベルの階層的なコントラスト損失ベースの ResNet152 分類器を使用します。
実験では、モデルをトレーニングするための動物クラスのみを含む ImageNet (ILSVRC-12) データセットのサブセットを使用し、トレーニングされたモデルを評価するために未確認クラスの独自のデータセットを作成しました。
私たちのモデルは、未知のオブジェクトを一般的なカテゴリに分類する際に満足のいく結果をもたらします。このカテゴリについては、後でさらに詳しく説明します。

要約(オリジナル)

Few-shot object classification is the task of classifying objects in an image with limited number of examples as supervision. We propose a one-shot/few-shot classification model that can classify an object of any unseen class into a relatively general category in an hierarchically based classification. Our model uses a three-level hierarchical contrastive loss based ResNet152 classifier for classifying an object based on its features extracted from Image embedding, not used during the training phase. For our experimentation, we have used a subset of the ImageNet (ILSVRC-12) dataset that contains only the animal classes for training our model and created our own dataset of unseen classes for evaluating our trained model. Our model provides satisfactory results in classifying the unknown objects into a generic category which has been later discussed in greater detail.

arxiv情報

著者 Arpit Mittal,Harshil Jhaveri,Swapnil Mallick,Abhishek Ajmera
発行日 2023-10-12 13:11:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク