RankED: Addressing Imbalance and Uncertainty in Edge Detection Using Ranking-based Losses

要約

画像内のエッジの検出には、(P1) 正のクラスと負のクラス間の大きな不均衡、および (P2) 異なるアノテーター間の不一致によるラベルの不確実性の問題があります。
既存のソリューションは、クラスバランスのとれたクロスエントロピー損失とダイス損失を使用して P1 に対処し、ほとんどのアノテーターによって合意されたエッジのみを予測することによって P2 に対処します。
この論文では、不均衡問題 (P1) と不確実性問題 (P2) の両方に対処する統合ランキングベースのアプローチである RankED を提案します。
RankED は、これら 2 つの問題に 2 つのコンポーネントで取り組みます。1 つはポジティブ ピクセルをネガティブ ピクセルよりもランク付けするコンポーネント、もう 1 つは信頼性の高いエッジ ピクセルがラベルの確実性を高めることを促進するコンポーネントです。
RankED が以前の研究を上回っており、NYUD-v2、BSDS500、およびマルチキュー データセットで新しい最先端の技術を確立していることを示します。
コードは https://ranked-cvpr24.github.io で入手できます。

要約(オリジナル)

Detecting edges in images suffers from the problems of (P1) heavy imbalance between positive and negative classes as well as (P2) label uncertainty owing to disagreement between different annotators. Existing solutions address P1 using class-balanced cross-entropy loss and dice loss and P2 by only predicting edges agreed upon by most annotators. In this paper, we propose RankED, a unified ranking-based approach that addresses both the imbalance problem (P1) and the uncertainty problem (P2). RankED tackles these two problems with two components: One component which ranks positive pixels over negative pixels, and the second which promotes high confidence edge pixels to have more label certainty. We show that RankED outperforms previous studies and sets a new state-of-the-art on NYUD-v2, BSDS500 and Multi-cue datasets. Code is available at https://ranked-cvpr24.github.io.

arxiv情報

著者 Bedrettin Cetinkaya,Sinan Kalkan,Emre Akbas
発行日 2024-03-07 11:22:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク