Drawing Attention to Detail: Pose Alignment through Self-Attention for Fine-Grained Object Classification

要約

オープン ワールドでのクラス内変動は、分類タスクでさまざまな課題につながります。
これらの課題を克服するために、きめの細かい分類が導入され、多くのアプローチが提案されました。
画像内の識別可能なローカル パーツを見つけて使用することに依存して、視点の変更、クラス内の差異、およびローカル パーツの変形に対する不変性を実現するものもあります。
P2P-Netに触発された私たちのアプローチは、エンドツーエンドのトレーニング可能なアテンションベースのパーツアライメントモジュールを提供し、そこで使用されるグラフマッチングコンポーネントをセルフアテンションメカニズムに置き換えます。
Attention モジュールは、全体的な損失に寄与する前に、互いに注意を払いながらパーツの最適な配置を学習できます。

要約(オリジナル)

Intra-class variations in the open world lead to various challenges in classification tasks. To overcome these challenges, fine-grained classification was introduced, and many approaches were proposed. Some rely on locating and using distinguishable local parts within images to achieve invariance to viewpoint changes, intra-class differences, and local part deformations. Our approach, which is inspired by P2P-Net, offers an end-to-end trainable attention-based parts alignment module, where we replace the graph-matching component used in it with a self-attention mechanism. The attention module is able to learn the optimal arrangement of parts while attending to each other, before contributing to the global loss.

arxiv情報

著者 Salwa Al Khatib,Mohamed El Amine Boudjoghra,Jameel Hassan
発行日 2023-02-09 17:47:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク