Global Collinearity-aware Polygonizer for Polygonal Building Mapping in Remote Sensing

要約

本論文では、リモートセンシング画像から多角形の建物をマッピングするという課題に取り組み、Global Collinearity-aware Polygonizer(GCP)という新しいアルゴリズムを紹介する。GCPは、インスタンス分割フレームワークに基づいて構築され、任意のインスタンス分割モデルによって生成されたバイナリマスクを処理する。このアルゴリズムは、バイナリマスクの輪郭に沿ってサンプリングされたポリラインを収集することから始まる。これらのポリラインは、変換器ベースの回帰モジュールを使用した精密化プロセスを経て、対象となる建物インスタンスの輪郭に正確に適合するようにします。その後、共線性を考慮したポリゴン簡略化モジュールが、これらの洗練されたポリラインを簡略化し、最終的なポリゴン表現を生成する。このモジュールは動的計画法を用いて、ポリゴンの単純さと忠実さのバランスをとる目的関数を最適化し、全体最適解を達成します。さらに、最適化された共線性を考慮した目的関数は、ネットワーク学習にシームレスに統合され、パイプライン全体のまとまりを強化します。GCPの有効性は、ポリゴンマッピングのための2つの公開ベンチマークで検証された。さらなる実験により、任意のポリゴンに対して、事前知識なしに、共線性を考慮したポリゴンの単純化モジュールを適用することで、ダグラス・プッカーアルゴリズムのような従来の手法よりも精度が向上することが明らかになりました。この発見は、GCPの適用範囲の広さを強調している。提案手法のコードは、https://github.com/zhu-xlab。

要約(オリジナル)

This paper addresses the challenge of mapping polygonal buildings from remote sensing images and introduces a novel algorithm, the Global Collinearity-aware Polygonizer (GCP). GCP, built upon an instance segmentation framework, processes binary masks produced by any instance segmentation model. The algorithm begins by collecting polylines sampled along the contours of the binary masks. These polylines undergo a refinement process using a transformer-based regression module to ensure they accurately fit the contours of the targeted building instances. Subsequently, a collinearity-aware polygon simplification module simplifies these refined polylines and generate the final polygon representation. This module employs dynamic programming technique to optimize an objective function that balances the simplicity and fidelity of the polygons, achieving globally optimal solutions. Furthermore, the optimized collinearity-aware objective is seamlessly integrated into network training, enhancing the cohesiveness of the entire pipeline. The effectiveness of GCP has been validated on two public benchmarks for polygonal building mapping. Further experiments reveal that applying the collinearity-aware polygon simplification module to arbitrary polylines, without prior knowledge, enhances accuracy over traditional methods such as the Douglas-Peucker algorithm. This finding underscores the broad applicability of GCP. The code for the proposed method will be made available at https://github.com/zhu-xlab.

arxiv情報

著者 Fahong Zhang,Yilei Shi,Xiao Xiang Zhu
発行日 2025-05-02 16:49:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク