要約
セマンティックセグメンテーションは、各画素に対応するカテゴリをラベル付けすることに特化した古典的なコンピュータビジョン問題である。産業品質検査、リモートセンシング情報抽出、医療診断支援、自律走行などの高度なタスクの基本タスクとして、セマンティックセグメンテーションはディープラーニングと組み合わせて長い間開発されており、多くの研究が蓄積されてきた。しかし、古典的なFCNベースの研究も、一般的なTransformerベースの研究も、画素ラベルのきめ細かい局所化を達成できておらず、この分野の主要な課題として残っています。近年、自律走行の普及に伴い、道路シーンのセグメンテーションが注目されている。我々は、クロスタスク整合性理論に基づき、意味的セグメンテーションタスクにエッジプリアを組み込むことで、より良い結果を得ることを目指す。主な貢献は、道路と非道路シーンのデータセットで検証した、余分な推論実行時オーバーヘッドをゼロにして意味分割モデルの精度を向上させる、モデルにとらわれない方法を提供することである。実験結果より、本手法は効果的にセマンティックセグメンテーションの精度を向上させることができる。
要約(オリジナル)
Semantic segmentation is a classic computer vision problem dedicated to labeling each pixel with its corresponding category. As a basic task for advanced tasks such as industrial quality inspection, remote sensing information extraction, medical diagnostic aid, and autonomous driving, semantic segmentation has been developed for a long time in combination with deep learning, and a lot of works have been accumulated. However, neither the classic FCN-based works nor the popular Transformer-based works have attained fine-grained localization of pixel labels, which remains the main challenge in this field. Recently, with the popularity of autonomous driving, the segmentation of road scenes has received increasing attention. Based on the cross-task consistency theory, we incorporate edge priors into semantic segmentation tasks to obtain better results. The main contribution is that we provide a model-agnostic method that improves the accuracy of semantic segmentation models with zero extra inference runtime overhead, verified on the datasets of road and non-road scenes. From our experimental results, our method can effectively improve semantic segmentation accuracy.
arxiv情報
著者 | Dan Zhang,Rui Zheng |
発行日 | 2022-11-09 07:56:33+00:00 |
arxivサイト | arxiv_id(pdf) |