Terrain Diffusion Network: Climatic-Aware Terrain Generation with Geological Sketch Guidance

要約

スケッチベースの地形生成は、コンピューター ゲーム、アニメーション、仮想現実などのさまざまなアプリケーションの仮想環境に現実的な風景を作成することを目的としています。
最近、深層学習ベースの地形生成、特に敵対的生成ネットワーク (GAN) に基づくものが登場しました。
ただし、これらの方法は、柔軟なユーザー制御の要件を満たし、現実的な地形の生成多様性を維持するのに苦労することがよくあります。
そこで、我々は、河川、尾根、盆地、山頂などの地形の特徴を考慮して、ユーザーガイダンスを積極的に取り入れて制御性を向上させる、新しい拡散ベースの手法である地形拡散ネットワーク(TDN)を提案します。
地形の詳細の忠実度やユーザー制御との整合性が損なわれることが多い従来のモノリシックなノイズ除去プロセスに固執する代わりに、特に関連する詳細な詳細を考慮して、より現実的な地形を生成するマルチレベルのノイズ除去スキームが提案されています。
浸食や地殻活動の影響を受ける気候パターンに影響を与えます。
具体的には、3 つの地形シンセサイザーが構造レベル、中間レベル、および細粒レベルのノイズ除去を目的として設計されており、各シンセサイザーが異なる地形の側面に集中できるようになります。
さらに、TDN の効率を最大化するために、事前にトレーニングされた地形オートエンコーダーを使用して、シンセサイザーに地形とスケッチ潜在空間をさらに導入します。
NASA トポロジ画像から構築された新しいデータセットでの包括的な実験により、提案された方法の有効性が明確に実証され、最先端のパフォーマンスが達成されました。
私たちのコードとデータセットは一般公開されます。

要約(オリジナル)

Sketch-based terrain generation seeks to create realistic landscapes for virtual environments in various applications such as computer games, animation and virtual reality. Recently, deep learning based terrain generation has emerged, notably the ones based on generative adversarial networks (GAN). However, these methods often struggle to fulfill the requirements of flexible user control and maintain generative diversity for realistic terrain. Therefore, we propose a novel diffusion-based method, namely terrain diffusion network (TDN), which actively incorporates user guidance for enhanced controllability, taking into account terrain features like rivers, ridges, basins, and peaks. Instead of adhering to a conventional monolithic denoising process, which often compromises the fidelity of terrain details or the alignment with user control, a multi-level denoising scheme is proposed to generate more realistic terrains by taking into account fine-grained details, particularly those related to climatic patterns influenced by erosion and tectonic activities. Specifically, three terrain synthesisers are designed for structural, intermediate, and fine-grained level denoising purposes, which allow each synthesiser concentrate on a distinct terrain aspect. Moreover, to maximise the efficiency of our TDN, we further introduce terrain and sketch latent spaces for the synthesizers with pre-trained terrain autoencoders. Comprehensive experiments on a new dataset constructed from NASA Topology Images clearly demonstrate the effectiveness of our proposed method, achieving the state-of-the-art performance. Our code and dataset will be publicly available.

arxiv情報

著者 Zexin Hu,Kun Hu,Clinton Mo,Lei Pan,Zhiyong Wang
発行日 2023-08-31 13:41:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.MM パーマリンク