A Comparative Study on Multi-task Uncertainty Quantification in Semantic Segmentation and Monocular Depth Estimation

要約

ディープ ニューラル ネットワークは、セマンティック セグメンテーションや単眼奥行き推定などの認識タスクに優れており、自動運転や産業検査などの安全性が重要なアプリケーションには不可欠です。
ただし、特にドメイン外のデータの場合、自信過剰や説明可能性の低さに悩まされることがよくあります。
不確実性の定量化はこれらの課題に対する有望な解決策として浮上していますが、マルチタスク設定についてはまだ検討されていません。
これを解明するために、結合セマンティック セグメンテーションと単眼深度推定について、モンテカルロ ドロップアウト、ディープ サブアンサンブル、およびディープ アンサンブルを評価します。
これにより、特にドメイン外のシナリオでは、ディープ アンサンブルが好ましい選択肢として際立っていることが明らかになり、両方のタスクを別々に解決する場合と比較して、不確実性の質に関してマルチタスク学習の潜在的な利点が示されます。
さらに、不確実性の中央値が堅牢なデフォルトとして浮上し、さまざまな不確実性しきい値を使用してピクセルを確実または不確実として分類することの影響を強調します。

要約(オリジナル)

Deep neural networks excel in perception tasks such as semantic segmentation and monocular depth estimation, making them indispensable in safety-critical applications like autonomous driving and industrial inspection. However, they often suffer from overconfidence and poor explainability, especially for out-of-domain data. While uncertainty quantification has emerged as a promising solution to these challenges, multi-task settings have yet to be explored. In an effort to shed light on this, we evaluate Monte Carlo Dropout, Deep Sub-Ensembles, and Deep Ensembles for joint semantic segmentation and monocular depth estimation. Thereby, we reveal that Deep Ensembles stand out as the preferred choice, particularly in out-of-domain scenarios, and show the potential benefit of multi-task learning with regard to the uncertainty quality in comparison to solving both tasks separately. Additionally, we highlight the impact of employing different uncertainty thresholds to classify pixels as certain or uncertain, with the median uncertainty emerging as a robust default.

arxiv情報

著者 Steven Landgraf,Markus Hillemann,Theodor Kapler,Markus Ulrich
発行日 2025-01-16 16:27:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク