要約
磁気共鳴 (MR) 画像の取得では、スキャン時間が短いと画像ノイズが高くなります。
したがって、深層学習手法を使用した自動画像ノイズ除去には大きな関心が寄せられています。
根や血管などの線状構造を含む MR 画像は、接続された構造を表示し、情報がまばらであるため、特別な特徴をもたらします。
この種のデータの場合、ノイズ除去ネットワークをトレーニングするときにボクセル近傍を考慮することが重要です。
この論文では、以前に 2D データに対して行ったように、損失関数内の未訓練ネットワークの特徴マップを比較することにより、知覚損失を 3D データに変換します。
私たちは、脳血管を表示する MR 画像 (MR 血管造影図 – MRA) と土壌中の植物の根の画像の 3D 画像ノイズ除去に対する未訓練知覚損失 (uPL) のパフォーマンスをテストしました。
重みの初期化、ネットワークの深さ、カーネル サイズ、プーリング操作などのさまざまな uPL 特性が結果に与える影響を調査します。
構造類似性指数メトリック (SSIM) などの評価メトリックを使用して、4 つのライス ノイズ レベルで uPL 損失のパフォーマンスをテストしました。
私たちの uPL は、L1 損失や構造類似性インデックス メトリック (SSIM) に基づく損失などの従来の損失関数よりも優れていることがわかります。
uPL ネットワークの初期化は重要ではありませんが、ネットワークの深さとプーリング操作はノイズ除去パフォーマンスに影響します。
例えば。
どちらのデータセットでも、5 つの畳み込み層を含むネットワークでは最高のパフォーマンスが得られましたが、層が多いネットワークではパフォーマンスが低下しました。
また、小規模な uPL ネットワークでは、VGG などの大規模なネットワークを使用するよりも優れた、または同等の結果が得られることもわかりました。
両方のデータセット、すべてのノイズ レベル、および 3 つのネットワーク アーキテクチャについて、損失の優れたパフォーマンスが観察されました。
結論として、線状の構造を含む画像の場合、uPL は 3D 画像のノイズ除去のための他の損失関数の代替手段となります。
要約(オリジナル)
In the acquisition of Magnetic Resonance (MR) images shorter scan times lead to higher image noise. Therefore, automatic image denoising using deep learning methods is of high interest. MR images containing line-like structures such as roots or vessels yield special characteristics as they display connected structures and yield sparse information. For this kind of data, it is important to consider voxel neighborhoods when training a denoising network. In this paper, we translate the Perceptual Loss to 3D data by comparing feature maps of untrained networks in the loss function as done previously for 2D data. We tested the performance of untrained Perceptual Loss (uPL) on 3D image denoising of MR images displaying brain vessels (MR angiograms – MRA) and images of plant roots in soil. We investigate the impact of various uPL characteristics such as weight initialization, network depth, kernel size, and pooling operations on the results. We tested the performance of the uPL loss on four Rician noise levels using evaluation metrics such as the Structural Similarity Index Metric (SSIM). We observe, that our uPL outperforms conventional loss functions such as the L1 loss or a loss based on the Structural Similarity Index Metric (SSIM). The uPL network’s initialization is not important, while network depth and pooling operations impact denoising performance. E.g. for both datasets a network with five convolutional layers led to the best performance while a network with more layers led to a performance drop. We also find that small uPL networks led to better or comparable results than using large networks such as VGG. We observe superior performance of our loss for both datasets, all noise levels, and three network architectures. In conclusion, for images containing line-like structures, uPL is an alternative to other loss functions for 3D image denoising.
arxiv情報
著者 | Elisabeth Pfaehler,Daniel Pflugfelder,Hanno Scharr |
発行日 | 2025-01-21 16:11:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google