要約
地球観測画像のセマンティック セグメンテーションの計算における高い要件に対処するために、現在の最先端のパイプラインは、対応するデータをより小さな画像に分割します。
既存の手法とベンチマーク データセットは、多くの場合、ピクセルベースのタイル スキームや、Web マッピング アプリケーションで採用されているジオタイル スキームに依存しています。
サブイメージ (サイズ、位置、方向を含む) の選択は、各ピクセルの利用可能なコンテキスト情報に影響し、トレーニング中のタイルの数を定義し、タイルのダウンサンプリングおよびアップサンプリング中の情報劣化の程度に影響するため、非常に重要です。
コンテンツをセグメンテーション モデルで必要なサイズに調整します。
この論文では、ラスター データの地理情報に基づいて地理タイルを作成するタイル スキームに依存する、地球観測画像用の新しいセグメンテーション パイプラインを提案します。
このアプローチは、ピクセルベースまたは一般的な Web マッピングのアプローチと比較して、いくつかの有益な特性を示します。
たとえば、提案されたタイル スキームは、タイルの粒度、タイル ストライド、画像境界の配置に関する柔軟なカスタマイズ プロパティを示します。これにより、トレーニング中にタイル固有のデータ拡張を実行したり、トレーニング中に重複するタイルのデータを使用して限定されたコンテキスト情報でピクセル予測を置き換えたりすることができます。
推論。
さらに、生成されたタイルは、全体的に一貫した空間タイル範囲を示します。
異種センサー、さまざまな記録距離、さまざまな緯度。
私たちの実験では、提案されたタイリング システムが現在の最先端のセマンティック セグメンテーション モデルの結果をどのように改善できるかを実証します。
将来の研究を促進するために、ソースコードを公開します。
要約(オリジナル)
To cope with the high requirements during the computation of semantic segmentations of earth observation imagery, current state-of-the-art pipelines divide the corresponding data into smaller images. Existing methods and benchmark datasets oftentimes rely on pixel-based tiling schemes or on geo-tiling schemes employed by web mapping applications. The selection of the subimages (comprising size, location and orientation) is crucial since it affects the available context information of each pixel, defines the number of tiles during training, and influences the degree of information degradation while down- and up-sampling the tile contents to the size required by the segmentation model. In this paper we propose a new segmentation pipeline for earth observation imagery relying on a tiling scheme that creates geo-tiles based on the geo-information of the raster data. This approach exhibits several beneficial properties compared to pixel-based or common web mapping approaches. For instance, the proposed tiling scheme shows flexible customization properties regarding tile granularity, tile stride and image boundary alignment, which allows us to perform a tile specific data augmentation during training and a substitution of pixel predictions with limited context information using data of overlapping tiles during inference. Furthermore, the generated tiles show a consistent spatial tile extent w.r.t. heterogeneous sensors, varying recording distances and different latitudes. In our experiments we demonstrate how the proposed tiling system allows to improve the results of current state-of-the-art semantic segmentation models. To foster future research we make the source code publicly available.
arxiv情報
著者 | Sebastian Bullinger,Florian Fevers,Christoph Bodensteiner,Michael Arens |
発行日 | 2023-06-01 15:46:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google