FD-Vision Mamba for Endoscopic Exposure Correction

要約

内視鏡画像撮影では、記録される画像に露出異常が発生しやすいため、医療従事者の意思決定を支援するために高画質な画像を維持することが重要です。
この問題を解決するために、我々は、内視鏡画像の周波数領域を再構成することで高品質な画像露出補正を実現する、FD-Vision Mamba (FDVM-Net) と呼ばれる周波数領域ベースのネットワークを設計します。
具体的には、状態空間シーケンス モデル (SSM) からインスピレーションを得て、畳み込み層の局所特徴抽出機能と、長距離依存関係をキャプチャする SSM の機能を統合する C-SSM ブロックを開発しました。
C-SSM を基本機能セルとして 2 つのパスのネットワークが構築され、これら 2 つのパスはそれぞれ画像の位相情報と振幅情報を処理します。
最後に、劣化した内視鏡画像をFDVM-Netで再構築し、高画質で鮮明な画像を取得します。
広範な実験結果は、私たちの方法が速度と精度の点で最先端の結果を達成することを実証しており、私たちの方法が任意の解像度の内視鏡画像を強化できることは注目に値します。
コードの URL は \url{https://github.com/zzr-idam/FDVM-Net} です。

要約(オリジナル)

In endoscopic imaging, the recorded images are prone to exposure abnormalities, so maintaining high-quality images is important to assist healthcare professionals in performing decision-making. To overcome this issue, We design a frequency-domain based network, called FD-Vision Mamba (FDVM-Net), which achieves high-quality image exposure correction by reconstructing the frequency domain of endoscopic images. Specifically, inspired by the State Space Sequence Models (SSMs), we develop a C-SSM block that integrates the local feature extraction ability of the convolutional layer with the ability of the SSM to capture long-range dependencies. A two-path network is built using C-SSM as the basic function cell, and these two paths deal with the phase and amplitude information of the image, respectively. Finally, a degraded endoscopic image is reconstructed by FDVM-Net to obtain a high-quality clear image. Extensive experimental results demonstrate that our method achieves state-of-the-art results in terms of speed and accuracy, and it is noteworthy that our method can enhance endoscopic images of arbitrary resolution. The URL of the code is \url{https://github.com/zzr-idam/FDVM-Net}.

arxiv情報

著者 Zhuoran Zheng,Jun Zhang
発行日 2024-02-14 16:48:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク