Lossy compression of multidimensional medical images using sinusoidal activation networks: an evaluation study

要約

本研究では、周期的活性化関数を持つニューラルネットワークを活用して、大規模な多次元医用画像データセットを確実に圧縮する方法を、4次元拡散強調MRI(dMRI)への概念実証を交えて評価する。医用画像診断において、多次元MRIは、その下にある組織の微細構造に対して感度と特異性の両方を持つバイオマーカーを開発するための重要な研究分野である。しかし、これらのデータの高次元の性質は、ストレージと共有能力および関連するコストの両方の点で課題をもたらし、低次元空間の情報を表現できる適切なアルゴリズムが必要とされます。最近の深層学習の理論的発展により、周期的活性化関数が画像の暗黙の神経表現のための強力なツールであり、2D画像の圧縮に使用できることが示されている。ここでは、このアプローチを4D画像に拡張し、任意の4D dMRIデータセットが正弦波活性化ネットワークのパラメータを通じて正確に表現され、標準的なDEFLATEアルゴリズムよりも約10倍高いデータ圧縮率を達成する方法を示す。提案手法は、平均二乗誤差、ピークSN比、構造類似度指数において、ベンチマークのReLUおよびTanh活性化パーセプトロンアーキテクチャを凌駕することが示された。さらに、テンソル表現と球面調和表現を用いた解析により、提案する非可逆圧縮は元データの特性を正確に再現し、ベンチマークのJPEG2000非可逆圧縮よりも約5〜10倍低い相対誤差をもたらし、MP-PCAデノージングなどの標準前処理ステップと同様に、臨床応用に現在認められているレベル内の情報損失を示唆しています。

要約(オリジナル)

In this work, we evaluate how neural networks with periodic activation functions can be leveraged to reliably compress large multidimensional medical image datasets, with proof-of-concept application to 4D diffusion-weighted MRI (dMRI). In the medical imaging landscape, multidimensional MRI is a key area of research for developing biomarkers that are both sensitive and specific to the underlying tissue microstructure. However, the high-dimensional nature of these data poses a challenge in terms of both storage and sharing capabilities and associated costs, requiring appropriate algorithms able to represent the information in a low-dimensional space. Recent theoretical developments in deep learning have shown how periodic activation functions are a powerful tool for implicit neural representation of images and can be used for compression of 2D images. Here we extend this approach to 4D images and show how any given 4D dMRI dataset can be accurately represented through the parameters of a sinusoidal activation network, achieving a data compression rate about 10 times higher than the standard DEFLATE algorithm. Our results show that the proposed approach outperforms benchmark ReLU and Tanh activation perceptron architectures in terms of mean squared error, peak signal-to-noise ratio and structural similarity index. Subsequent analyses using the tensor and spherical harmonics representations demonstrate that the proposed lossy compression reproduces accurately the characteristics of the original data, leading to relative errors about 5 to 10 times lower than the benchmark JPEG2000 lossy compression and similar to standard pre-processing steps such as MP-PCA denosing, suggesting a loss of information within the currently accepted levels for clinical application.

arxiv情報

著者 Matteo Mancini,Derek K. Jones,Marco Palombo
発行日 2022-08-03 15:24:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, eess.IV, physics.med-ph パーマリンク