Quantifying Statistical Significance of Neural Network-based Image Segmentation by Selective Inference

要約

ディープ ニューラル ネットワーク (DNN) を使用する画像セグメンテーション方法に関連する文献は膨大にありますが、セグメンテーション結果の統計的信頼性を評価することにはあまり注意が払われていません。
この研究では、セグメンテーションの結果を DNN によって駆動される仮説 (DNN 駆動仮説と呼ばれる) として解釈し、統計的仮説検定フレームワーク内でこれらの仮説の信頼性を定量化する方法を提案します。
具体的には、オブジェクト領域と背景領域の違いに関する統計的仮説検定を検討します。
DNN のデータへの適応により、違いが誤って大きくなるため、この問題は困難です。
この困難を克服するために、条件付き選択的推論 (SI) フレームワーク (最近かなりの注目を集めているデータ駆動型仮説の新しい統計的推論フレームワーク) を導入して、セグメンテーションの正確な (非漸近的) 有効な p 値を計算します。
結果。
DNN ベースのセグメンテーションに条件付き SI フレームワークを使用するために、ホモトピー法に基づく新しい SI アルゴリズムを開発します。これにより、DNN 駆動仮説の正確な (非漸近的) サンプリング分布を導き出すことができます。
合成データセットと実世界データセットの両方で実験を行い、提案した方法が偽陽性率をうまく制御でき、計算効率の点で優れたパフォーマンスを発揮し、医療画像データに適用した場合に優れた結果をもたらすという証拠を提供します。

要約(オリジナル)

Although a vast body of literature relates to image segmentation methods that use deep neural networks (DNNs), less attention has been paid to assessing the statistical reliability of segmentation results. In this study, we interpret the segmentation results as hypotheses driven by DNN (called DNN-driven hypotheses) and propose a method by which to quantify the reliability of these hypotheses within a statistical hypothesis testing framework. Specifically, we consider a statistical hypothesis test for the difference between the object and background regions. This problem is challenging, as the difference would be falsely large because of the adaptation of the DNN to the data. To overcome this difficulty, we introduce a conditional selective inference (SI) framework — a new statistical inference framework for data-driven hypotheses that has recently received considerable attention — to compute exact (non-asymptotic) valid p-values for the segmentation results. To use the conditional SI framework for DNN-based segmentation, we develop a new SI algorithm based on the homotopy method, which enables us to derive the exact (non-asymptotic) sampling distribution of DNN-driven hypothesis. We conduct experiments on both synthetic and real-world datasets, through which we offer evidence that our proposed method can successfully control the false positive rate, has good performance in terms of computational efficiency, and provides good results when applied to medical image data.

arxiv情報

著者 Vo Nguyen Le Duy,Shogo Iwazaki,Ichiro Takeuchi
発行日 2022-12-14 09:08:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, stat.ML パーマリンク