Masked Gamma-SSL: Learning Uncertainty Estimation via Masked Image Modeling

要約

この研究では、単一の順方向パスで高品質の不確実性推定を生成するセマンティック セグメンテーション ネットワークを提案しています。
私たちは、マスク イメージ モデリング (MIM) アプローチを通じて基礎モデルとラベルのないデータセットからの一般的な表現を活用します。これは、ハイパーパラメーターの拡張に対して堅牢で、以前の手法よりも簡単です。
安全性が重要なアプリケーションで使用されるニューラル ネットワークの場合、トレーニング データの偏りがエラーにつながる可能性があります。
したがって、実行時にネットワークの制限を理解し、それに応じて行動することが重要です。
この目的を達成するために、私たちは、密集した都市、田舎、およびオフロードの運転ドメインからのラベル付きテスト データを含む SAX セグメンテーション ベンチマークを含む、多数のテスト ドメインで提案された方法をテストします。
提案された手法は、この困難なベンチマークにおいて、不確実性推定および分布外 (OoD) 手法を常に上回ります。

要約(オリジナル)

This work proposes a semantic segmentation network that produces high-quality uncertainty estimates in a single forward pass. We exploit general representations from foundation models and unlabelled datasets through a Masked Image Modeling (MIM) approach, which is robust to augmentation hyper-parameters and simpler than previous techniques. For neural networks used in safety-critical applications, bias in the training data can lead to errors; therefore it is crucial to understand a network’s limitations at run time and act accordingly. To this end, we test our proposed method on a number of test domains including the SAX Segmentation benchmark, which includes labelled test data from dense urban, rural and off-road driving domains. The proposed method consistently outperforms uncertainty estimation and Out-of-Distribution (OoD) techniques on this difficult benchmark.

arxiv情報

著者 David S. W. Williams,Matthew Gadd,Paul Newman,Daniele De Martini
発行日 2024-02-27 15:49:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク