Hinge-Wasserstein: Mitigating Overconfidence in Regression by Classification


特別に設計された合成データセットでの実験を通じて、完全なグラウンド トゥルース分布が存在しない場合、従来の損失関数が確率分布の推定値の低下と深刻な過信につながることを実証しました。
これにより、複数のモードによる複雑な分布の予測が可能になり、完全なグラウンド トゥルース分布が利用できないデータセットでのトレーニングが可能になります。
広範な実験により、提案された損失により、水平線検出とステレオ視差推定という 2 つの困難なコンピュータ ビジョン タスクにおける不確実性推定が大幅に改善されることが示されました。


Computer vision systems that are deployed in safety-critical applications need to quantify their output uncertainty. We study regression from images to parameter values and here it is common to detect uncertainty by predicting probability distributions. In this context, we investigate the regression-by-classification paradigm which can represent multimodal distributions, without a prior assumption on the number of modes. Through experiments on a specifically designed synthetic dataset, we demonstrate that traditional loss functions lead to poor probability distribution estimates and severe overconfidence, in the absence of full ground truth distributions. In order to alleviate these issues, we propose hinge-Wasserstein — a simple improvement of the Wasserstein loss that reduces the penalty for weak secondary modes during training. This enables prediction of complex distributions with multiple modes, and allows training on datasets where full ground truth distributions are not available. In extensive experiments, we show that the proposed loss leads to substantially better uncertainty estimation on two challenging computer vision tasks: horizon line detection and stereo disparity estimation.


著者 Ziliang Xiong,Arvi Jonnarth,Abdelrahman Eldesokey,Joakim Johnander,Bastian Wandt,Per-Erik Forssen
発行日 2023-11-22 14:02:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク