要約
「ブラックボックス」モデルの視覚的な説明により、人工知能 (AI) の研究者や専門家は、そのような方法のローカライゼーション能力を大幅に活用できるようになりました。
単一オブジェクトの分類問題に適用される開発された視覚的説明方法のほとんどにもかかわらず、それらは検出タスクでは十分に調査されておらず、課題は単純な粗い領域ベースの識別を超える可能性があります。
これは、検出器がさまざまな視点からスケールの異なる複数のオブジェクトに直面する必要がある場合、または対象のオブジェクトが存在しない場合に特に重要です。
この論文では、空中画像における樹冠検出の挑戦的で動的な問題について、信頼できる視覚的説明を生成する CrownCAM を提案します。
樹木の樹冠の細粒度のローカリゼーションと、気を散らす可能性のあるものや樹冠のないシーンが存在する非常に密集した森林樹木のシナリオに対して、文脈に依存しない背景の抑制を効率的に提供します。
さらに、2 つの Intersection over Union (IoU) ベースのメトリックが導入され、画像内の樹冠の有無にかかわらず、生成された視覚的な説明の正確さと不正確さの両方を効果的に定量化できます。
経験的評価は、提案された Crown-CAM が Score-CAM、Augmented ScoreCAM、および Eigen-CAM メソッドよりも、精度の向上においてそれぞれ 8.7、5.3、および 21.7 (および 3.3、9.8、および 16.5) の平均 IoU マージンで優れていることを示しています (
困難な NEON 樹冠データセットに関する視覚的な説明の不正確さの減少)。
要約(オリジナル)
Visual explanation of ‘black-box’ models has enabled researchers and experts in artificial intelligence (AI) to exploit the localization abilities of such methods to a much greater extent. Despite most of the developed visual explanation methods applied to single object classification problems, they are not well-explored in the detection task, where the challenges may go beyond simple coarse area-based discrimination. This is of particular importance when a detector should face several objects with different scales from various viewpoints or if the objects of interest are absent. In this paper, we propose CrownCAM to generate reliable visual explanations for the challenging and dynamic problem of tree crown detection in aerial images. It efficiently provides fine-grain localization of tree crowns and non-contextual background suppression for scenarios with highly dense forest trees in the presence of potential distractors or scenes without tree crowns. Additionally, two Intersection over Union (IoU)-based metrics are introduced that can effectively quantify both the accuracy and inaccuracy of generated visual explanations with respect to regions with or without tree crowns in the image. Empirical evaluations demonstrate that the proposed Crown-CAM outperforms the Score-CAM, Augmented ScoreCAM, and Eigen-CAM methods by an average IoU margin of 8.7, 5.3, and 21.7 (and 3.3, 9.8, and 16.5) respectively in improving the accuracy (and decreasing inaccuracy) of visual explanations on the challenging NEON tree crown dataset.
arxiv情報
著者 | Seyed Mojtaba Marvasti-Zadeh,Devin Goodsman,Nilanjan Ray,Nadir Erbilgin |
発行日 | 2022-11-23 17:01:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google