STPLS3D: A Large-Scale Synthetic and Real Aerial Photogrammetry 3D Point Cloud Dataset

要約

最近、さまざまな機能とスケールを持つさまざまな 3D データセットが提案されていますが、個人が大規模なデータ収集、サニタイズ、および注釈のパイプライン全体を完了することは依然として困難です。
さらに、作成されたデータセットは、通常、極端に不均衡なクラス分布または部分的な低品質のデータ サンプルに悩まされます。
これに動機付けられて、手続き的に合成された 3D データ生成パラダイムを探求し、大規模な注釈付き写真測量点群を作成する完全な機能を個人に提供します。
具体的には、オープンな地理空間データ ソースと市販の商用パッケージを最大限に活用する合成航空写真測量点群生成パイプラインを紹介します。
仮想ゲームで合成データを生成する場合とは異なり、シミュレートされたデータは通常、アーティストによって作成されたゲーム環境が限られていますが、提案されたパイプラインは、さまざまな合成地形の形状と建物の密度で同じ UAV 飛行パターンに従うことにより、実際の環境の再構築プロセスをシミュレートします。
実際のデータと同様の品質、ノイズ パターン、および多様性。
さらに、正確なセマンティック アノテーションとインスタンス アノテーションを完全に自動的に生成できるため、費用と時間のかかる手動アノテーションを回避できます。
提案されたパイプラインに基づいて、STPLS3D と呼ばれる豊富な注釈付きの合成 3D 航空写真測量ポイント クラウド データセットを提示します。このデータセットには、16 $km^2$ を超える風景と最大 18 のきめの細かいセマンティック カテゴリが含まれます。
検証のために、実環境の 4 つの領域から収集された並列データセットも提供します。
データセットに対して実施された広範な実験により、提案された合成データセットの有効性と品質が実証されました。

要約(オリジナル)

Although various 3D datasets with different functions and scales have been proposed recently, it remains challenging for individuals to complete the whole pipeline of large-scale data collection, sanitization, and annotation. Moreover, the created datasets usually suffer from extremely imbalanced class distribution or partial low-quality data samples. Motivated by this, we explore the procedurally synthetic 3D data generation paradigm to equip individuals with the full capability of creating large-scale annotated photogrammetry point clouds. Specifically, we introduce a synthetic aerial photogrammetry point clouds generation pipeline that takes full advantage of open geospatial data sources and off-the-shelf commercial packages. Unlike generating synthetic data in virtual games, where the simulated data usually have limited gaming environments created by artists, the proposed pipeline simulates the reconstruction process of the real environment by following the same UAV flight pattern on different synthetic terrain shapes and building densities, which ensure similar quality, noise pattern, and diversity with real data. In addition, the precise semantic and instance annotations can be generated fully automatically, avoiding the expensive and time-consuming manual annotation. Based on the proposed pipeline, we present a richly-annotated synthetic 3D aerial photogrammetry point cloud dataset, termed STPLS3D, with more than 16 $km^2$ of landscapes and up to 18 fine-grained semantic categories. For verification purposes, we also provide a parallel dataset collected from four areas in the real environment. Extensive experiments conducted on our datasets demonstrate the effectiveness and quality of the proposed synthetic dataset.

arxiv情報

著者 Meida Chen,Qingyong Hu,Zifan Yu,Hugues Thomas,Andrew Feng,Yu Hou,Kyle McCullough,Fengbo Ren,Lucio Soibelman
発行日 2022-10-14 01:35:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク