Hierarchical Salient Patch Identification for Interpretable Fundus Disease Localization

要約

医用画像解析におけるディープラーニング技術の応用の広がりに伴い、モデル予測の効果的な説明と診断精度の向上が喫緊の課題となっています。
アトリビューション手法は、医師がモデルの診断根拠をより深く理解するのに役立つ重要なツールとなっており、医療画像で疾患を説明し位置を特定するために使用されます。
しかし、これまでの方法では、複雑で多様な構造を持つ眼底疾患の位置特定が不正確かつ不完全であるという問題がありました。
これらの問題を解決するために、我々は、画像レベルのラベルとニューラルネットワーク分類器(NNC)のみを使用して解釈可能な疾患位置特定を達成できる、階層的顕著パッチ識別(HSPI)と呼ばれる弱教師あり解釈可能な眼底疾患位置特定方法を提案します。
まず、疾患の位置を特定するために、画像をいくつかのパッチに分割し、一貫性の損失を最適化して入力画像内のどのパッチがネットワークの予測にとって最も重要であるかを特定する顕著パッチ識別 (SPI) を提案します。
次に、疾患領域を包括的に特定するために、ニューラル ネットワーク分類器の予測に対するさまざまな領域の重要性を SPI に分析させる階層的識別戦略を提案します。
次に、マスク ベクトルが疾患領域を正確に特定できるようにするために、条件付きピーク フォーカスが導入されます。
最後に、誤って識別された非疾患領域または追加で識別された非疾患領域をフィルタリングするために、マルチサイズの交差に基づいたパッチ選択を提案します。
私たちは眼底画像データセットで疾患の位置特定実験を実施し、以前の解釈可能な帰属方法と比較して複数の評価指標で最高のパフォーマンスを達成します。
各方法の有効性を検証するために、追加のアブレーション研究が実施されます。

要約(オリジナル)

With the widespread application of deep learning technology in medical image analysis, the effective explanation of model predictions and improvement of diagnostic accuracy have become urgent problems that need to be solved. Attribution methods have become key tools to help doctors better understand the diagnostic basis of models, and are used to explain and localize diseases in medical images. However, previous methods suffer from inaccurate and incomplete localization problems for fundus diseases with complex and diverse structures. To solve these problems, we propose a weakly supervised interpretable fundus disease localization method called hierarchical salient patch identification (HSPI) that can achieve interpretable disease localization using only image-level labels and a neural network classifier (NNC). First, we propose salient patch identification (SPI), which divides the image into several patches and optimizes consistency loss to identify which patch in the input image is most important for the network’s prediction, in order to locate the disease. Second, we propose a hierarchical identification strategy to force SPI to analyze the importance of different areas to neural network classifier’s prediction to comprehensively locate disease areas. Conditional peak focusing is then introduced to ensure that the mask vector can accurately locate the disease area. Finally, we propose patch selection based on multi-sized intersections to filter out incorrectly or additionally identified non-disease regions. We conduct disease localization experiments on fundus image datasets and achieve the best performance on multiple evaluation metrics compared to previous interpretable attribution methods. Additional ablation studies are conducted to verify the effectiveness of each method.

arxiv情報

著者 Yitao Peng,Lianghua He,Die Hu
発行日 2024-08-21 13:46:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク