Optimal Transport Guided Unsupervised Learning for Enhancing low-quality Retinal Images

要約

実際の無散瞳網膜眼底撮影では、特定の眼疾患や全身疾患がある場合、アーチファクトや不完全性、低品質が発生しがちです。このようなアーチファクトは、臨床診断において不正確さや曖昧さをもたらす可能性がある。本論文では、低品質の網膜眼底画像を補正するためのシンプルかつ効果的なエンドツーエンドのフレームワークを提案する。最適輸送理論を活用し、低画質画像を高画質画像に変換するための非対称画像間変換スキームを提案した。また、生成器と識別器を備えたGenerative Adversarial Networks (GAN)モデルがこのタスクに十分であることを理論的に証明した。さらに、低品質画像とその拡張領域間の情報の不整合を緩和するため、元領域と拡張領域間の構造的整合性(光ディスク、血管、病変)を最大限維持する情報整合性機構を提案した。EyeQデータセットを用いた広範な実験を行い、提案手法の優位性を知覚的・定量的に実証した。

要約(オリジナル)

Real-world non-mydriatic retinal fundus photography is prone to artifacts, imperfections and low-quality when certain ocular or systemic co-morbidities exist. Artifacts may result in inaccuracy or ambiguity in clinical diagnoses. In this paper, we proposed a simple but effective end-to-end framework for enhancing poor-quality retinal fundus images. Leveraging the optimal transport theory, we proposed an unpaired image-to-image translation scheme for transporting low-quality images to their high-quality counterparts. We theoretically proved that a Generative Adversarial Networks (GAN) model with a generator and discriminator is sufficient for this task. Furthermore, to mitigate the inconsistency of information between the low-quality images and their enhancements, an information consistency mechanism was proposed to maximally maintain structural consistency (optical discs, blood vessels, lesions) between the source and enhanced domains. Extensive experiments were conducted on the EyeQ dataset to demonstrate the superiority of our proposed method perceptually and quantitatively.

arxiv情報

著者 Wenhui Zhu,Peijie Qiu,Mohammad Farazi,Keshav Nandakumar,Oana M. Dumitrascu,Yalin Wang
発行日 2023-02-06 18:29:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV, stat.ML パーマリンク