要約
タイトル:高温改善と背景抑制による細かい視覚分類
要約:
– 細かい視覚分類は、同一カテゴリのデータ内の顕著な差異とカテゴリ間の高い類似性により、困難なタスクである。
– これらの課題に対処するため、以前の戦略は、カテゴリ間の微妙な差異を特定し、識別的な特徴を強化することに焦点を当てていた。
– しかし、背景もまた、モデルに必要のない特徴を伝える重要な情報を提供するため、微妙な特徴に過度に依存するモデルは、グローバルな特徴や文脈情報を見落とす可能性がある。
– この論文では、高温改善と背景抑制と呼ばれる2つのモジュールから構成される HERBS という新しいネットワークを提案し、それぞれ、識別的な特徴を抽出し、背景ノイズを抑制する。
– 高温改善モジュールにより、モデルはさまざまなスケールで特徴マップを改善し、多様な特徴の学習を改善することで、適切な特徴スケールを学習することができる。
– 背景抑制モジュールは、分類信頼度スコアを使用して特徴マップを前景と背景に分割し、低信頼度領域で特徴値を抑制し、識別的な特徴を強化する。
– 実験結果は、提案された HERBS が、様々なスケールの特徴を統合し、背景ノイズを抑制し、適切なスケールで識別的な特徴を備えた結果、CUB-200-2011およびNABirdsのベンチマークで最先端のパフォーマンスを発揮することを示している。
– したがって、HERBS は細かい視覚分類タスクのパフォーマンスを改善するための有望な解決策である。
要約(オリジナル)
Fine-grained visual classification is a challenging task due to the high similarity between categories and distinct differences among data within one single category. To address the challenges, previous strategies have focused on localizing subtle discrepancies between categories and enhencing the discriminative features in them. However, the background also provides important information that can tell the model which features are unnecessary or even harmful for classification, and models that rely too heavily on subtle features may overlook global features and contextual information. In this paper, we propose a novel network called “High-temperaturE Refinement and Background Suppression” (HERBS), which consists of two modules, namely, the high-temperature refinement module and the background suppression module, for extracting discriminative features and suppressing background noise, respectively. The high-temperature refinement module allows the model to learn the appropriate feature scales by refining the features map at different scales and improving the learning of diverse features. And, the background suppression module first splits the features map into foreground and background using classification confidence scores and suppresses feature values in low-confidence areas while enhancing discriminative features. The experimental results show that the proposed HERBS effectively fuses features of varying scales, suppresses background noise, discriminative features at appropriate scales for fine-grained visual classification.The proposed method achieves state-of-the-art performance on the CUB-200-2011 and NABirds benchmarks, surpassing 93% accuracy on both datasets. Thus, HERBS presents a promising solution for improving the performance of fine-grained visual classification tasks. code: https://github.com/chou141253/FGVC-HERBS
arxiv情報
著者 | Po-Yung Chou,Yu-Yung Kao,Cheng-Hung Lin |
発行日 | 2023-04-25 00:51:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI