要約
Generative Adversarial Networks (GAN) はディープラーニングの分野で注目を集めており、ランダム ノイズからの現実的なデータの生成を容易にします。
GAN の有効性は、多くの場合、アーキテクチャの重要な側面である特徴抽出の品質に依存します。
このペーパーでは、離散ウェーブレット変換 (DWT) の機能を深層学習手法で活用する、新しくて堅牢な特徴抽出ツールである L-WaveBlock を紹介します。
L-WaveBlock は、GAN ジェネレーターの収束を迅速化し、同時にパフォーマンスを向上させるように設計されています。
この論文では、道路衛星画像データセット、CelebA データセット、GoPro データセットの 3 つのデータセットにわたる L-WaveBlock の顕著な有用性を実証し、特徴抽出を容易にし、より効率的にする機能を示しています。
DWT を利用することで、L-WaveBlock は構造とテクスチャの両方の複雑な詳細を効率的にキャプチャし、重要な情報を同時に保持しながら、特徴マップを複数のスケールにわたって直交するサブバンドにさらに分割します。
L-WaveBlock を採用することで、より高速な収束につながるだけでなく、すべてのデータセットで適切な結果が得られます。
提案された方法は、マップ データセットで 3.6959 のインセプション スコアと 0.4261 の構造類似性インデックス、CelebA データセットで 29.05 のピーク信号対雑音比と 0.874 の構造類似性インデックスを達成します。
提案された方法は、画像ノイズ除去データセットに関して最先端の性能を発揮しますが、優れているわけではありませんが、それでも従来の方法よりも高速な収束につながります。
これにより、L-WaveBlock は GAN ベースの画像生成を強化するための堅牢かつ効率的なツールとして浮上し、画像解像度、画像生成、画像ノイズ除去に関して複数のデータセットにわたって優れた収束速度と競争力のあるパフォーマンスを実証します。
要約(オリジナル)
Generative Adversarial Networks (GANs) have risen to prominence in the field of deep learning, facilitating the generation of realistic data from random noise. The effectiveness of GANs often depends on the quality of feature extraction, a critical aspect of their architecture. This paper introduces L-WaveBlock, a novel and robust feature extractor that leverages the capabilities of the Discrete Wavelet Transform (DWT) with deep learning methodologies. L-WaveBlock is catered to quicken the convergence of GAN generators while simultaneously enhancing their performance. The paper demonstrates the remarkable utility of L-WaveBlock across three datasets, a road satellite imagery dataset, the CelebA dataset and the GoPro dataset, showcasing its ability to ease feature extraction and make it more efficient. By utilizing DWT, L-WaveBlock efficiently captures the intricate details of both structural and textural details, and further partitions feature maps into orthogonal subbands across multiple scales while preserving essential information at the same time. Not only does it lead to faster convergence, but also gives competent results on every dataset by employing the L-WaveBlock. The proposed method achieves an Inception Score of 3.6959 and a Structural Similarity Index of 0.4261 on the maps dataset, a Peak Signal-to-Noise Ratio of 29.05 and a Structural Similarity Index of 0.874 on the CelebA dataset. The proposed method performs competently to the state-of-the-art for the image denoising dataset, albeit not better, but still leads to faster convergence than conventional methods. With this, L-WaveBlock emerges as a robust and efficient tool for enhancing GAN-based image generation, demonstrating superior convergence speed and competitive performance across multiple datasets for image resolution, image generation and image denoising.
arxiv情報
著者 | Mirat Shah,Vansh Jain,Anmol Chokshi,Guruprasad Parasnis,Pramod Bide |
発行日 | 2023-11-09 17:47:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google