要約
弱教師セマンティック セグメンテーション (WSSS) は、トレーニング用に画像レベルのラベルのみを指定してピクセル単位の分類を実行します。
この課題は困難であるにもかかわらず、研究コミュニティは過去 5 年間で有望な結果を達成しました。
それでも、現在の WSSS 文献には、さまざまなサイズのオブジェクトに対してメソッドがどの程度うまく機能するかについての詳細な意味が欠けています。
したがって、さまざまなオブジェクトサイズにわたる包括的な評価を提供し、サイズバランスの取れた評価セットを収集して PASCAL VOC を補完する新しい評価指標を提案します。
これら 2 つのガジェットを使用すると、既存の WSSS メソッドが小さなオブジェクトを捕捉するのに苦労していることがわかります。
さらに、適切なトレーニング戦略と組み合わせた、サイズバランスの取れたクロスエントロピー損失を提案します。
一般に、3 つの異なるデータセットに関する 10 のベースラインに基づいて検証されているように、既存の WSSS メソッドが改善されます。
要約(オリジナル)
Weakly-supervised semantic segmentation (WSSS) performs pixel-wise classification given only image-level labels for training. Despite the difficulty of this task, the research community has achieved promising results over the last five years. Still, current WSSS literature misses the detailed sense of how well the methods perform on different sizes of objects. Thus we propose a novel evaluation metric to provide a comprehensive assessment across different object sizes and collect a size-balanced evaluation set to complement PASCAL VOC. With these two gadgets, we reveal that the existing WSSS methods struggle in capturing small objects. Furthermore, we propose a size-balanced cross-entropy loss coupled with a proper training strategy. It generally improves existing WSSS methods as validated upon ten baselines on three different datasets.
arxiv情報
著者 | Cheolhyun Mun,Sanghuk Lee,Youngjung Uh,Junsuk Choe,Hyeran Byun |
発行日 | 2023-09-25 13:15:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google