要約
セマンティック セグメンテーションは、各ピクセルに対応するカテゴリのラベルを付けることに特化した古典的なコンピューター ビジョンの問題です。
産業品質検査、リモートセンシング情報抽出、医療診断支援、自動運転などの高度なタスクの基本タスクとして、ディープラーニングと組み合わせたセマンティック セグメンテーションが古くから開発され、多くの研究が蓄積されてきました。
ただし、古典的な FCN ベースの作品も人気のある Transformer ベースの作品も、ピクセル ラベルのきめ細かなローカリゼーションを達成していません。これは、この分野の主な課題のままです。
近年、自動運転の普及に伴い、道路シーンのセグメンテーションが注目されています。
クロスタスク一貫性理論に基づいて、セマンティック セグメンテーション タスクにエッジ プライアを組み込み、より良い結果を取得します。
主な貢献は、道路シーンと非道路シーンのデータセットで検証された、追加の推論ランタイム オーバーヘッドなしでセマンティック セグメンテーション モデルの精度を向上させる、モデルに依存しない方法を提供することです。
実験結果から、私たちの方法はセマンティックセグメンテーションの精度を効果的に向上させることができます。
要約(オリジナル)
Semantic segmentation is a classic computer vision problem dedicated to labeling each pixel with its corresponding category. As a basic task for advanced tasks such as industrial quality inspection, remote sensing information extraction, medical diagnostic aid, and autonomous driving, semantic segmentation has been developed for a long time in combination with deep learning, and a lot of works have been accumulated. However, neither the classic FCN-based works nor the popular Transformer-based works have attained fine-grained localization of pixel labels, which remains the main challenge in this field. Recently, with the popularity of autonomous driving, the segmentation of road scenes has received increasing attention. Based on the cross-task consistency theory, we incorporate edge priors into semantic segmentation tasks to obtain better results. The main contribution is that we provide a model-agnostic method that improves the accuracy of semantic segmentation models with zero extra inference runtime overhead, verified on the datasets of road and non-road scenes. From our experimental results, our method can effectively improve semantic segmentation accuracy.
arxiv情報
| 著者 | Dan Zhang,Rui Zheng,Luosang Gadeng,Pei Yang |
| 発行日 | 2022-11-10 02:35:16+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google