DP-Net: Learning Discriminative Parts for image recognition

要約

この論文では、強力な解釈機能を備えたディープ アーキテクチャである Discriminative Part Network (DP-Net) について説明します。これは、部品ベースの認識モジュールと組み合わせた事前学習済みの畳み込みニューラル ネットワーク (CNN) を活用します。
このシステムは、CNN を微調整することなく、カテゴリ間で区別できる画像内のパーツを学習して検出するため、他のパーツベースのモデルよりも拡張性が高くなります。
パーツベースのアプローチは当然解釈可能な表現を提供しますが、私たちは画像およびカテゴリレベルでの説明を提案し、より識別しやすくするためにパーツ学習プロセスに特定の制約を導入します。

要約(オリジナル)

This paper presents Discriminative Part Network (DP-Net), a deep architecture with strong interpretation capabilities, which exploits a pretrained Convolutional Neural Network (CNN) combined with a part-based recognition module. This system learns and detects parts in the images that are discriminative among categories, without the need for fine-tuning the CNN, making it more scalable than other part-based models. While part-based approaches naturally offer interpretable representations, we propose explanations at image and category levels and introduce specific constraints on the part learning process to make them more discrimative.

arxiv情報

著者 Ronan Sicre,Hanwei Zhang,Julien Dejasmin,Chiheb Daaloul,Stéphane Ayache,Thierry Artières
発行日 2024-04-23 13:42:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク