Lossy compression of multidimensional medical images using sinusoidal activation networks: an evaluation study

要約

この作業では、4D 拡散強調 MRI (dMRI) への概念実証アプリケーションを使用して、定期的な活性化関数を備えたニューラル ネットワークを活用して、大規模な多次元医療画像データセットを確実に圧縮する方法を評価します。
医用画像の世界では、多次元 MRI は、基礎となる組織の微細構造に敏感で特異的なバイオマーカーを開発するための重要な研究分野です。
ただし、これらのデータの高次元の性質は、ストレージと共有の機能と関連するコストの両方の点で課題をもたらし、低次元空間で情報を表現できる適切なアルゴリズムを必要とします。
深層学習における最近の理論的発展は、周期活性化関数が画像の暗黙的なニューラル表現のための強力なツールであり、2D 画像の圧縮に使用できることを示しています。
ここでは、このアプローチを 4D 画像に拡張し、任意の 4D dMRI データセットを正弦波活性化ネットワークのパラメーターを介して正確に表現し、標準の DEFLATE アルゴリズムよりも約 10 倍高いデータ圧縮率を達成する方法を示します。
私たちの結果は、提案されたアプローチが、平均二乗誤差、ピーク信号対雑音比、および構造類似性指数の点で、ベンチマークの ReLU および Tanh 活性化パーセプトロン アーキテクチャよりも優れていることを示しています。
テンソルおよび球面調和関数表現を使用したその後の分析は、提案された非可逆圧縮が元のデータの特性を正確に再現し、ベンチマーク JPEG2000 非可逆圧縮よりも約 5 ~ 10 分の 1 の相対誤差をもたらし、次のような標準的な前処理手順と同様であることを示しています。
MP-PCA denosing は、臨床応用のために現在受け入れられているレベル内での情報の損失を示唆しています。

要約(オリジナル)

In this work, we evaluate how neural networks with periodic activation functions can be leveraged to reliably compress large multidimensional medical image datasets, with proof-of-concept application to 4D diffusion-weighted MRI (dMRI). In the medical imaging landscape, multidimensional MRI is a key area of research for developing biomarkers that are both sensitive and specific to the underlying tissue microstructure. However, the high-dimensional nature of these data poses a challenge in terms of both storage and sharing capabilities and associated costs, requiring appropriate algorithms able to represent the information in a low-dimensional space. Recent theoretical developments in deep learning have shown how periodic activation functions are a powerful tool for implicit neural representation of images and can be used for compression of 2D images. Here we extend this approach to 4D images and show how any given 4D dMRI dataset can be accurately represented through the parameters of a sinusoidal activation network, achieving a data compression rate about 10 times higher than the standard DEFLATE algorithm. Our results show that the proposed approach outperforms benchmark ReLU and Tanh activation perceptron architectures in terms of mean squared error, peak signal-to-noise ratio and structural similarity index. Subsequent analyses using the tensor and spherical harmonics representations demonstrate that the proposed lossy compression reproduces accurately the characteristics of the original data, leading to relative errors about 5 to 10 times lower than the benchmark JPEG2000 lossy compression and similar to standard pre-processing steps such as MP-PCA denosing, suggesting a loss of information within the currently accepted levels for clinical application.

arxiv情報

著者 Matteo Mancini,Derek K. Jones,Marco Palombo
発行日 2022-08-02 17:16:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph パーマリンク