要約
Fine-Grained Visual分類(FGVC)は、密接に関連するサブクラスを分類することを目的としています。これは、最小限のクラス間の違いとクラス内の有意な分散によって複雑なタスクです。
既存の方法は、多くの場合、画像分類のための追加の注釈に依存しており、階層ラベルの関係を描いたツリー階層に埋め込まれた貴重な情報を見落としています。
この知識を活用して分類の精度と一貫性を改善するために、新しい階層間双方向の一貫性学習(CHBC)フレームワークを提案します。
CHBCフレームワークは、特別に設計されたモジュールを使用して、注意マスクと機能を分解および強化するさまざまな階層全体で識別機能を抽出します。
双方向の一貫性の損失を使用して、異なる階層にわたって分類の結果を調節し、ラベル予測の一貫性を確保し、誤分類を削減します。
広く使用されている3つのFGVCデータセットでの実験は、CHBCフレームワークの有効性を検証します。
アブレーション研究では、提案されたモジュールの重要な貢献を強調し、機能の強化と一貫性の制約のアプリケーション戦略をさらに調査します。
要約(オリジナル)
Fine-Grained Visual Classification (FGVC) aims to categorize closely related subclasses, a task complicated by minimal inter-class differences and significant intra-class variance. Existing methods often rely on additional annotations for image classification, overlooking the valuable information embedded in Tree Hierarchies that depict hierarchical label relationships. To leverage this knowledge to improve classification accuracy and consistency, we propose a novel Cross-Hierarchical Bidirectional Consistency Learning (CHBC) framework. The CHBC framework extracts discriminative features across various hierarchies using a specially designed module to decompose and enhance attention masks and features. We employ bidirectional consistency loss to regulate the classification outcomes across different hierarchies, ensuring label prediction consistency and reducing misclassification. Experiments on three widely used FGVC datasets validate the effectiveness of the CHBC framework. Ablation studies further investigate the application strategies of feature enhancement and consistency constraints, underscoring the significant contributions of the proposed modules.
arxiv情報
著者 | Pengxiang Gao,Yihao Liang,Yanzhi Song,Zhouwang Yang |
発行日 | 2025-04-18 10:30:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google