Quantifying Model Uncertainty for Semantic Segmentation using Operators in the RKHS

要約

セマンティックセグメンテーションのための深層学習モデルは、タスクの非常に困難な性質のため、実世界のアプリケーションではパフォーマンスが低下しがちである。モデルの不確実性定量化(UQ)は、セグメンテーションの出力をどの程度信頼すべきかを実務家が知ることを可能にすることで、モデルの信頼性の欠如というこの問題に対処する1つの方法である。このアプリケーション領域における現在のUQ手法は、主にベイズベースの手法に限定されており、これらは計算コストが高く、不確実性の中心モーメントしか抽出できないため、不確実性推定の品質が制限される。我々は、再現カーネルヒルベルト空間(RKHS)におけるモデルの特徴空間に関連する不確実性の複数モーメント関数定義を活用した、意味的セグメンテーションモデルの高解像度予測不確実性定量化のためのシンプルなフレームワークを提示する。このフレームワークから抽出された複数の不確実性関数は、モデルの特徴空間の局所的な密度ダイナミクスによって定義されるため、連続的に高次のモーメントがより不確実な領域を定量化するように、特徴空間の固有確率密度関数の末尾領域(不確実性が最も高い場所)に自動的に配置されます。これにより、従来のベイズ法に比べて、モデルの不確実性をより正確に把握することができます。さらに、このようなモーメントの抽出は単発計算で行われるため、ベイズ法やアンサンブル法(モデルの不確実性を定量化するために多くの確率的前進を伴う)よりもはるかに高速に行うことができます。我々は、2つのベンチマーク道路シーンセグメンテーションデータセット(CamvidとCityscapes)上で学習・評価された4つの異なる最先端モデルアーキテクチャ上に実装された我々のフレームワークの実験的評価を通じて、これらの利点を実証する。

要約(オリジナル)

Deep learning models for semantic segmentation are prone to poor performance in real-world applications due to the highly challenging nature of the task. Model uncertainty quantification (UQ) is one way to address this issue of lack of model trustworthiness by enabling the practitioner to know how much to trust a segmentation output. Current UQ methods in this application domain are mainly restricted to Bayesian based methods which are computationally expensive and are only able to extract central moments of uncertainty thereby limiting the quality of their uncertainty estimates. We present a simple framework for high-resolution predictive uncertainty quantification of semantic segmentation models that leverages a multi-moment functional definition of uncertainty associated with the model’s feature space in the reproducing kernel Hilbert space (RKHS). The multiple uncertainty functionals extracted from this framework are defined by the local density dynamics of the model’s feature space and hence automatically align themselves at the tail-regions of the intrinsic probability density function of the feature space (where uncertainty is the highest) in such a way that the successively higher order moments quantify the more uncertain regions. This leads to a significantly more accurate view of model uncertainty than conventional Bayesian methods. Moreover, the extraction of such moments is done in a single-shot computation making it much faster than Bayesian and ensemble approaches (that involve a high number of forward stochastic passes of the model to quantify its uncertainty). We demonstrate these advantages through experimental evaluations of our framework implemented over four different state-of-the-art model architectures that are trained and evaluated on two benchmark road-scene segmentation datasets (Camvid and Cityscapes).

arxiv情報

著者 Rishabh Singh,Jose C. Principe
発行日 2022-11-03 17:10:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.IT, cs.LG, eess.IV, math.IT パーマリンク