Hyperbolic Uncertainty Aware Semantic Segmentation

要約

セマンティック セグメンテーション (SS) は、各ピクセルを事前定義されたクラスの 1 つに分類することを目的としています。
このタスクは、自動運転車や自律型ドローンにおいて重要な役割を果たします。
SS では、多くの研究で、誤って分類されたピクセルのほとんどは、一般的に不確実性の高い物体の境界付近にあることが示されています。
ただし、既存の SS 損失関数は、トレーニング中にこれらの不確実なピクセルを処理するように調整されていません。これらのピクセルは通常、自信を持って分類されたピクセルとして同等に扱われ、任意の低歪みでユークリッド空間に埋め込むことができないため、SS のパフォーマンスが低下します。
この問題を解決するために、この論文では、双曲線距離を介してトレーニング中に双曲線空間内の誤分類された不確実性の高いピクセルを動的に強調表示する「双曲線不確実性損失」(HyperUL) を設計します。
提案された HyperUL はモデルに依存せず、さまざまなニューラル アーキテクチャに簡単に適用できます。
3 つの最近の SS モデルに HyperUL を採用した後の Cityscapes および UAVid データセットの実験結果から、既存の SS モデルのセグメンテーション パフォーマンスが一貫して向上できることが明らかになりました。

要約(オリジナル)

Semantic segmentation (SS) aims to classify each pixel into one of the pre-defined classes. This task plays an important role in self-driving cars and autonomous drones. In SS, many works have shown that most misclassified pixels are commonly near object boundaries with high uncertainties. However, existing SS loss functions are not tailored to handle these uncertain pixels during training, as these pixels are usually treated equally as confidently classified pixels and cannot be embedded with arbitrary low distortion in Euclidean space, thereby degenerating the performance of SS. To overcome this problem, this paper designs a ‘Hyperbolic Uncertainty Loss’ (HyperUL), which dynamically highlights the misclassified and high-uncertainty pixels in Hyperbolic space during training via the hyperbolic distances. The proposed HyperUL is model agnostic and can be easily applied to various neural architectures. After employing HyperUL to three recent SS models, the experimental results on Cityscapes and UAVid datasets reveal that the segmentation performance of existing SS models can be consistently improved.

arxiv情報

著者 Bike Chen,Wei Peng,Xiaofeng Cao,Juha Röning
発行日 2023-05-26 13:41:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク