要約
モデル分類のための画像ピクセルの重要性を表す視覚的な説明マップを生成する顕著性メソッドは、ニューラル ネットワークの決定を説明するための一般的な手法です。
顕著性マップの粒度と包括性を強化するために、この論文では、新しい説明マップ生成方法である階層動的マスク (HDM) が提案されています。
まず、動的マスク (DM) を提案します。これにより、複数の小さなサイズのベンチマーク マスク ベクトルが、最適化手法によって画像内の重要な情報を大まかに学習できるようになります。
次に、ベンチマーク マスク ベクトルは、大規模な補助マスク ベクトルの学習をガイドし、重ね合わせたマスクがきめの細かいピクセルの重要性情報を正確に学習し、敵対的摂動に対する感度を低下させることができるようにします。
さらに、DM モジュールを連結して HDM を構築します。
これらの DM モジュールは、学習ベースの方法で、マスク イメージ内の残りのニューラル ネットワーク分類決定で関心領域を見つけて融合するために使用されます。
HDM は DM にさまざまな領域で重要度分析を実行させるため、融合された顕著性マップをより包括的にします。
提案された方法は、自然および医療データセットでテストされた場合、認識およびローカリゼーション機能の点で以前のアプローチよりも大幅に優れていました。
要約(オリジナル)
Saliency methods generating visual explanatory maps representing the importance of image pixels for model classification is a popular technique for explaining neural network decisions. Hierarchical dynamic masks (HDM), a novel explanatory maps generation method, is proposed in this paper to enhance the granularity and comprehensiveness of saliency maps. First, we suggest the dynamic masks (DM), which enables multiple small-sized benchmark mask vectors to roughly learn the critical information in the image through an optimization method. Then the benchmark mask vectors guide the learning of large-sized auxiliary mask vectors so that their superimposed mask can accurately learn fine-grained pixel importance information and reduce the sensitivity to adversarial perturbations. In addition, we construct the HDM by concatenating DM modules. These DM modules are used to find and fuse the regions of interest in the remaining neural network classification decisions in the mask image in a learning-based way. Since HDM forces DM to perform importance analysis in different areas, it makes the fused saliency map more comprehensive. The proposed method outperformed previous approaches significantly in terms of recognition and localization capabilities when tested on natural and medical datasets.
arxiv情報
著者 | Yitao Peng,Longzhen Yang,Yihang Liu,Lianghua He |
発行日 | 2023-01-12 12:24:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google