A prototype-based model for set classification

要約

入力のセット(画像やテキストなど)の分類は、コンピュータービジョン(CV)と自然言語処理(NLP)の両方の研究領域です。
一連のベクトルを表す一般的な方法は、それらを線形部分空間としてモデル化することです。
この貢献では、このような線形サブスペースから形成されたマニホールドであるグラスマンマニホールドで学習するためのプロトタイプベースのアプローチを提示します。
提案された方法は、クラスの代表的な特性をキャプチャする一連の部分空間プロトタイプと、サブスペースの次元の選択を自動化する一連の関連要因を学習します。
これにより、各入力ベクトルの計算された影響が決定に及ぼす透明な分類剤モデルにつながります。
ベンチマーク画像とテキストデータセットの実験を通じて、パフォーマンスと説明可能性だけでなく計算リソース要件の観点から、変圧器ベースのモデルと比較して、提案された分類器の効率を実証しました。

要約(オリジナル)

Classification of sets of inputs (e.g., images and texts) is an active area of research within both computer vision (CV) and natural language processing (NLP). A common way to represent a set of vectors is to model them as linear subspaces. In this contribution, we present a prototype-based approach for learning on the manifold formed from such linear subspaces, the Grassmann manifold. Our proposed method learns a set of subspace prototypes capturing the representative characteristics of classes and a set of relevance factors automating the selection of the dimensionality of the subspaces. This leads to a transparent classifier model which presents the computed impact of each input vector on its decision. Through experiments on benchmark image and text datasets, we have demonstrated the efficiency of our proposed classifier, compared to the transformer-based models in terms of not only performance and explainability but also computational resource requirements.

arxiv情報

著者 Mohammad Mohammadi,Sreejita Ghosh
発行日 2025-04-28 12:46:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク