PRISTA-Net: Deep Iterative Shrinkage Thresholding Network for Coded Diffraction Patterns Phase Retrieval

要約

位相回復 (PR) の問題には、限られた振幅測定データから未知の画像を回復することが含まれており、計算によるイメージングおよび画像処理における課題となる非線形逆問題です。
ただし、PR 手法の多くは、解釈性に欠けるブラック ボックス ネットワーク モデルと、計算が複雑で慎重なパラメータ調整を必要とするプラグ アンド プレイ (PnP) フレームワークに基づいています。
これに対処するために、私たちは、一次反復収縮閾値アルゴリズム (ISTA) に基づいたディープ アンフォールディング ネットワーク (DUN) である PRISTA-Net を開発しました。
このネットワークは、学習可能な非線形変換を利用して、スパース事前確率に関連する近接点マッピング副問題に対処し、画像エッジ、テクスチャ、および構造を含む位相情報に焦点を当てるアテンション メカニズムを利用します。
さらに、高速フーリエ変換 (FFT) を使用してグローバルな特徴を学習してローカル情報を強化し、設計された対数ベースの損失関数により、ノイズ レベルが低い場合に大幅な改善がもたらされます。
提案されている PRISTA-Net フレームワークのすべてのパラメーター (非線形変換、しきい値パラメーター、ステップ サイズなど) は、手動で設定するのではなく、エンドツーエンドで学習されます。
この方法は、従来の方法の解釈可能性と深層学習の高速推論能力を組み合わせており、展開段階での反復ごとにノイズを処理できるため、回復品質が向上します。
コード化回折パターン (CDP) 測定の実験により、私たちのアプローチが定性的および定量的評価の点で既存の最先端の方法よりも優れていることが実証されました。
私たちのソース コードは \emph{https://github.com/liuaxou/PRISTA-Net} で入手できます。

要約(オリジナル)

The problem of phase retrieval (PR) involves recovering an unknown image from limited amplitude measurement data and is a challenge nonlinear inverse problem in computational imaging and image processing. However, many of the PR methods are based on black-box network models that lack interpretability and plug-and-play (PnP) frameworks that are computationally complex and require careful parameter tuning. To address this, we have developed PRISTA-Net, a deep unfolding network (DUN) based on the first-order iterative shrinkage thresholding algorithm (ISTA). This network utilizes a learnable nonlinear transformation to address the proximal-point mapping sub-problem associated with the sparse priors, and an attention mechanism to focus on phase information containing image edges, textures, and structures. Additionally, the fast Fourier transform (FFT) is used to learn global features to enhance local information, and the designed logarithmic-based loss function leads to significant improvements when the noise level is low. All parameters in the proposed PRISTA-Net framework, including the nonlinear transformation, threshold parameters, and step size, are learned end-to-end instead of being manually set. This method combines the interpretability of traditional methods with the fast inference ability of deep learning and is able to handle noise at each iteration during the unfolding stage, thus improving recovery quality. Experiments on Coded Diffraction Patterns (CDPs) measurements demonstrate that our approach outperforms the existing state-of-the-art methods in terms of qualitative and quantitative evaluations. Our source codes are available at \emph{https://github.com/liuaxou/PRISTA-Net}.

arxiv情報

著者 Aoxu Liu,Xiaohong Fan,Yin Yang,Jianping Zhang
発行日 2023-09-08 07:37:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.IR, cs.IT, eess.IV, math.IT パーマリンク