要約
オープン ワールドでのクラス内変動は、分類タスクでさまざまな課題につながります。
これらの課題を克服するために、きめの細かい分類が導入され、多くのアプローチが提案されました。
画像内の識別可能なローカル パーツを見つけて使用することに依存して、視点の変更、クラス内の差異、およびローカル パーツの変形に対する不変性を実現するものもあります。
P2P-Netに触発された私たちのアプローチは、エンドツーエンドのトレーニング可能なアテンションベースのパーツアライメントモジュールを提供し、そこで使用されるグラフマッチングコンポーネントをセルフアテンションメカニズムに置き換えます。
Attention モジュールは、全体的な損失に寄与する前に、互いに注意を払いながらパーツの最適な配置を学習できます。
要約(オリジナル)
Intra-class variations in the open world lead to various challenges in classification tasks. To overcome these challenges, fine-grained classification was introduced, and many approaches were proposed. Some rely on locating and using distinguishable local parts within images to achieve invariance to viewpoint changes, intra-class differences, and local part deformations. Our approach, which is inspired by P2P-Net, offers an end-to-end trainable attention-based parts alignment module, where we replace the graph-matching component used in it with a self-attention mechanism. The attention module is able to learn the optimal arrangement of parts while attending to each other, before contributing to the global loss.
arxiv情報
著者 | Salwa Al Khatib,Mohamed El Amine Boudjoghra,Jameel Hassan |
発行日 | 2023-02-09 17:47:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google