要約
画像分類のためのフューショット学習は、コンピューター ビジョンの注目のトピックとして取り上げられています。これは、限られた数のラベル付き画像から高速学習し、新しいタスクを一般化することを目的としています。
この論文では、フィッシャー スコアのアイデアに動機付けられて、代表的な局所記述子を適応的に選択し、追加のパラメーターを導入しない弁別局所記述子注意 (DLDA) モデルを提案します。一方、既存の局所記述子ベースの手法のほとんどはニューラル
ネットワークでは、必然的に面倒なパラメータ調整が必要になります。
さらに、クエリ点からの距離に応じて $k$ 最近傍の重みを調整することで、従来の $k$-NN 分類モデルを修正します。
4 つのベンチマーク データセットでの実験では、私たちの方法が少数ショット学習の最先端のアプローチと比較して高い精度を達成するだけでなく、$k$ の選択に対する感度が低いことも示しています。
要約(オリジナル)
Few-shot learning for image classification comes up as a hot topic in computer vision, which aims at fast learning from a limited number of labeled images and generalize over the new tasks. In this paper, motivated by the idea of Fisher Score, we propose a Discriminative Local Descriptors Attention (DLDA) model that adaptively selects the representative local descriptors and does not introduce any additional parameters, while most of the existing local descriptors based methods utilize the neural networks that inevitably involve the tedious parameter tuning. Moreover, we modify the traditional $k$-NN classification model by adjusting the weights of the $k$ nearest neighbors according to their distances from the query point. Experiments on four benchmark datasets show that our method not only achieves higher accuracy compared with the state-of-art approaches for few-shot learning, but also possesses lower sensitivity to the choices of $k$.
arxiv情報
著者 | Qijun Song,Siyun Zhou,Liwei Xu |
発行日 | 2023-05-15 15:33:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google