要約
セーフティクリティカルなアプリケーションに導入されるコンピュータビジョンシステムは、出力の不確実性を定量化する必要があります。
私たちは画像からパラメータ値への回帰を研究していますが、ここでは確率分布を予測することで不確実性を検出することが一般的です。
これに関連して、モードの数に関する事前の仮定なしに、多峰性分布を表現できる分類による回帰パラダイムを調査します。
特別に設計された合成データセットでの実験を通じて、完全なグラウンド トゥルース分布が存在しない場合、従来の損失関数が確率分布の推定値の低下と深刻な過信につながることを実証しました。
これらの問題を軽減するために、ヒンジ-ワッサーシュタインを提案します。これは、トレーニング中の弱い二次モードのペナルティを軽減するワッサーシュタイン損失の単純な改善です。
これにより、複数のモードによる複雑な分布の予測が可能になり、完全なグラウンド トゥルース分布が利用できないデータセットでのトレーニングが可能になります。
広範な実験により、提案された損失により、水平線検出とステレオ視差推定という 2 つの困難なコンピュータ ビジョン タスクにおける不確実性推定が大幅に改善されることが示されました。
要約(オリジナル)
Computer vision systems that are deployed in safety-critical applications need to quantify their output uncertainty. We study regression from images to parameter values and here it is common to detect uncertainty by predicting probability distributions. In this context, we investigate the regression-by-classification paradigm which can represent multimodal distributions, without a prior assumption on the number of modes. Through experiments on a specifically designed synthetic dataset, we demonstrate that traditional loss functions lead to poor probability distribution estimates and severe overconfidence, in the absence of full ground truth distributions. In order to alleviate these issues, we propose hinge-Wasserstein — a simple improvement of the Wasserstein loss that reduces the penalty for weak secondary modes during training. This enables prediction of complex distributions with multiple modes, and allows training on datasets where full ground truth distributions are not available. In extensive experiments, we show that the proposed loss leads to substantially better uncertainty estimation on two challenging computer vision tasks: horizon line detection and stereo disparity estimation.
arxiv情報
| 著者 | Ziliang Xiong,Arvi Jonnarth,Abdelrahman Eldesokey,Joakim Johnander,Bastian Wandt,Per-Erik Forssen | 
| 発行日 | 2023-11-22 14:02:07+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
