Multi-Class Segmentation from Aerial Views using Recursive Noise Diffusion

要約

空撮からのセマンティック セグメンテーションは、自律型ドローンが安全かつ効率的に移動するために正確かつ正確なセグメンテーションを必要とするため、重要なタスクです。
航空写真からの画像のセグメント化は、多様な視点、極端な縮尺の変化、シーンの複雑さが含まれるため、特に困難です。
この問題に対処するために、エンドツーエンドのマルチクラス セマンティック セグメンテーション拡散モデルを提案します。
再帰的ノイズ除去を導入して、予測誤差がノイズ除去プロセスを通じて伝播できるようにします。
さらに、これを階層的なマルチスケールアプローチと組み合わせて、拡散プロセスを補完します。
私たちの方法は、UAVid と Vaihingen 建物セグメンテーション ベンチマークで最先端の結果を達成します。

要約(オリジナル)

Semantic segmentation from aerial views is a vital task for autonomous drones as they require precise and accurate segmentation to traverse safely and efficiently. Segmenting images from aerial views is especially challenging as they include diverse view-points, extreme scale variation and high scene complexity. To address this problem, we propose an end-to-end multi-class semantic segmentation diffusion model. We introduce recursive denoising which allows predicted error to propagate through the denoising process. In addition, we combine this with a hierarchical multi-scale approach, complementary to the diffusion process. Our method achieves state-of-the-art results on UAVid and on the Vaihingen building segmentation benchmark.

arxiv情報

著者 Benedikt Kolbeinsson,Krystian Mikolajczyk
発行日 2022-12-01 18:59:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク