Domain Generalization with Fourier Transform and Soft Thresholding

要約

ドメインの一般化は、複数のソース ドメインでモデルをトレーニングし、目に見えないターゲット ドメインまで適切に一般化できるようにすることを目的としています。
多くのドメイン一般化手法の中で、フーリエ変換ベースのドメイン一般化手法が人気を博しているのは、主にフーリエ変換の力を利用してデータ内の重要なパターンと規則性を捕捉し、モデルをドメイン シフトに対してより堅牢にするためです。
主流のフーリエ変換ベースの領域一般化では、ソース イメージとターゲット イメージ間の位相スペクトルを維持しながら、フーリエ振幅スペクトルを交換します。
ただし、振幅スペクトルにおけるバックグラウンド干渉は無視されます。
この制限を克服するために、フーリエ領域にソフトしきい値関数を導入します。
私たちは、この新しく設計されたアルゴリズムを網膜眼底画像セグメンテーションに適用します。これは眼疾患の診断には重要ですが、ドメインのシフトにより、ソースが異なるとニューラル ネットワークのパフォーマンスが低下する可能性があります。
提案された技術は基本的に、フーリエ領域の小さな値を除去し、より良い一般化を提供することにより、眼底画像の増強を強化します。
フーリエ変換ベースの領域一般化と融合したソフトしきい値処理の革新的な性質により、ターゲット画像の背景干渉が大幅に低減され、ニューラル ネットワーク モデルのパフォーマンスが向上します。
公開データの実験により、優れたセグメンテーション メトリクスを備えた従来の手法や最先端の​​手法と比べて、当社のアプローチの有効性が検証されています。

要約(オリジナル)

Domain generalization aims to train models on multiple source domains so that they can generalize well to unseen target domains. Among many domain generalization methods, Fourier-transform-based domain generalization methods have gained popularity primarily because they exploit the power of Fourier transformation to capture essential patterns and regularities in the data, making the model more robust to domain shifts. The mainstream Fourier-transform-based domain generalization swaps the Fourier amplitude spectrum while preserving the phase spectrum between the source and the target images. However, it neglects background interference in the amplitude spectrum. To overcome this limitation, we introduce a soft-thresholding function in the Fourier domain. We apply this newly designed algorithm to retinal fundus image segmentation, which is important for diagnosing ocular diseases but the neural network’s performance can degrade across different sources due to domain shifts. The proposed technique basically enhances fundus image augmentation by eliminating small values in the Fourier domain and providing better generalization. The innovative nature of the soft thresholding fused with Fourier-transform-based domain generalization improves neural network models’ performance by reducing the target images’ background interference significantly. Experiments on public data validate our approach’s effectiveness over conventional and state-of-the-art methods with superior segmentation metrics.

arxiv情報

著者 Hongyi Pan,Bin Wang,Zheyuan Zhan,Xin Zhu,Debesh Jha,Ahmet Enis Cetin,Concetto Spampinato,Ulas Bagci
発行日 2023-09-18 15:28:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.IV パーマリンク