On advantages of Mask-level Recognition for Open-set Segmentation in the Wild

要約

ほとんどの高密度認識手法は、各ピクセルに個別の判断をもたらす。このアプローチは、小さな分類群を持つ通常のクローズドセットアップでは、まだ競争力のある性能を発揮する。しかし、自然界における重要なアプリケーションでは、一般的に強力なオープンセット性能と多数の既知のクラスが必要とされる。我々は、これらの2つの厳しいセットアップが、非調整ベースラインモデルの場合であっても、マスクレベルの予測から大きな恩恵を受けることを示す。さらに、意味境界における誤認識を効果的に減少させる、密な認識の不確実性の代替定式化を提案する。提案する定式化は、非常に強力なベースラインに対して更なる改善をもたらし、ネガティブデータで訓練することなく密な異常検出における新たな技術水準を設定するものである。また、我々の貢献は、最近のオープンセットパノプティックセットアップにおける性能向上にもつながる。詳細な実験により、ピクセルレベルの手掛かりをマスクレベルの予測に暗黙的に集約することにより、我々のアプローチが成功することが確認された。

要約(オリジナル)

Most dense recognition methods bring a separate decision in each particular pixel. This approach still delivers competitive performance in usual closed-set setups with small taxonomies. However, important applications in the wild typically require strong open-set performance and large numbers of known classes. We show that these two demanding setups greatly benefit from mask-level predictions, even in the case of non-finetuned baseline models. Moreover, we propose an alternative formulation of dense recognition uncertainty that effectively reduces false positive responses at semantic borders. The proposed formulation produces a further improvement over a very strong baseline and sets the new state of the art in dense anomaly detection without training on negative data. Our contributions also lead to a performance improvement in a recent open-set panoptic setup. In-depth experiments confirm that our approach succeeds due to implicit aggregation of pixel-level cues into mask-level predictions.

arxiv情報

著者 Matej Grcić,Josip Šarić,Siniša Šegvić
発行日 2023-01-09 14:59:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク