AUCSeg: AUC-oriented Pixel-level Long-tail Semantic Segmentation

要約

ROC 曲線下面積 (AUC) は、インスタンス レベルのロングテール学習問題を評価するためのよく知られた指標です。
過去 20 年間に、ロングテール分布の下でモデルのパフォーマンスを向上させるために、多くの AUC 最適化手法が提案されてきました。
このペーパーでは、より複雑なシナリオであるピクセル レベルのロングテール セマンティック セグメンテーションのコンテキストで AUC 最適化手法を検討します。
このタスクでは、AUC 最適化手法に 2 つの大きな課題が生じます。
一方で、ピクセルレベルのタスクにおける AUC の最適化には、構造化された内部画像およびペアごとの画像間の依存関係を伴う、損失項にわたる複雑な結合が含まれるため、理論的な分析が複雑になります。
一方で、この場合の AUC 損失のミニバッチ推定にはより大きなバッチ サイズが必要であり、その結果、スペースが許容不可能なほど複雑になることがわかりました。
これらの問題に対処するために、ピクセルレベルの AUC 損失関数を開発し、アルゴリズムの汎化能力の依存関係グラフに基づく理論分析を実行します。
さらに、大量のメモリ需要を管理するために、Tail-Classes メモリ バンク (T-Memory Bank) を設計します。
最後に、さまざまなベンチマークにわたる包括的な実験により、提案した AUCSeg 手法の有効性が確認されます。
コードは https://github.com/boyuh/AUCSeg で入手できます。

要約(オリジナル)

The Area Under the ROC Curve (AUC) is a well-known metric for evaluating instance-level long-tail learning problems. In the past two decades, many AUC optimization methods have been proposed to improve model performance under long-tail distributions. In this paper, we explore AUC optimization methods in the context of pixel-level long-tail semantic segmentation, a much more complicated scenario. This task introduces two major challenges for AUC optimization techniques. On one hand, AUC optimization in a pixel-level task involves complex coupling across loss terms, with structured inner-image and pairwise inter-image dependencies, complicating theoretical analysis. On the other hand, we find that mini-batch estimation of AUC loss in this case requires a larger batch size, resulting in an unaffordable space complexity. To address these issues, we develop a pixel-level AUC loss function and conduct a dependency-graph-based theoretical analysis of the algorithm’s generalization ability. Additionally, we design a Tail-Classes Memory Bank (T-Memory Bank) to manage the significant memory demand. Finally, comprehensive experiments across various benchmarks confirm the effectiveness of our proposed AUCSeg method. The code is available at https://github.com/boyuh/AUCSeg.

arxiv情報

著者 Boyu Han,Qianqian Xu,Zhiyong Yang,Shilong Bao,Peisong Wen,Yangbangyan Jiang,Qingming Huang
発行日 2024-09-30 15:31:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク