要約
ディープラーニングに基づく手法は、リモートセンシング画像からの建物の自動抽出の研究を大きく後押ししています。しかし、ベクトル化された規則的な建物輪郭を人間が行うように描画することは、その手法の難しさ、建物構造の多様性、不完全な撮像条件のために、依然として非常に困難である。本論文では、BuildMapperと名付けた、エンドツーエンドで学習可能な建築物輪郭抽出フレームワークを初めて提案し、人間が行うように建築物のポリゴンを直接かつ効率的に描画することができる。BuildMapperは2つの主要なコンポーネントから構成される。1) 建築物の初期輪郭を生成する輪郭初期化モジュール、2) 輪郭の頂点変形と縮小を行う輪郭進化モジュール、である。両コンポーネントにおいて、経験的手法に代わる学習可能な輪郭初期化法、静的頂点対応問題に対する動的予測頂点とグランドトゥルース頂点のペアリング、頂点情報抽出・集約のための軽量エンコーダなどの新しいアイデアを提供し、直接構造化建物輪郭抽出に光を当てる、建物コーナー頂点検出用のよくできた頂点分類ヘッドを搭載している。また、大規模な建築物データセットであるWHU-Mix(ベクトル)建築物データセットを構築し、輪郭に基づく建築物抽出手法の研究に役立てました。WHU-Mix (vector)データセット、WHUデータセット、CrowdAIデータセットに対して行った大規模実験の結果、BuildMapperはセグメンテーションベースと輪郭ベースの両方の手法よりも高いマスク平均精度(AP)と境界APで、最先端の性能を達成できることが検証された。
要約(オリジナル)
Deep learning based methods have significantly boosted the study of automatic building extraction from remote sensing images. However, delineating vectorized and regular building contours like a human does remains very challenging, due to the difficulty of the methodology, the diversity of building structures, and the imperfect imaging conditions. In this paper, we propose the first end-to-end learnable building contour extraction framework, named BuildMapper, which can directly and efficiently delineate building polygons just as a human does. BuildMapper consists of two main components: 1) a contour initialization module that generates initial building contours; and 2) a contour evolution module that performs both contour vertex deformation and reduction, which removes the need for complex empirical post-processing used in existing methods. In both components, we provide new ideas, including a learnable contour initialization method to replace the empirical methods, dynamic predicted and ground truth vertex pairing for the static vertex correspondence problem, and a lightweight encoder for vertex information extraction and aggregation, which benefit a general contour-based method; and a well-designed vertex classification head for building corner vertices detection, which casts light on direct structured building contour extraction. We also built a suitable large-scale building dataset, the WHU-Mix (vector) building dataset, to benefit the study of contour-based building extraction methods. The extensive experiments conducted on the WHU-Mix (vector) dataset, the WHU dataset, and the CrowdAI dataset verified that BuildMapper can achieve a state-of-the-art performance, with a higher mask average precision (AP) and boundary AP than both segmentation-based and contour-based methods.
arxiv情報
| 著者 | Shiqing Wei,Tao Zhang,Shunping Ji,Muying Luo,Jianya Gong | 
| 発行日 | 2022-11-07 08:58:35+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
