MI-SegNet: Mutual Information-Based US Segmentation for Unseen Domain Generalization

要約

ドメイン全体にわたる学習ベースの医用画像セグメンテーションの一般化機能は、現在、特に超音波 (US) 画像処理の場合、ドメイン シフトによって引き起こされるパフォーマンス低下によって制限されています。
米国の画像の品質は、慎重に調整された音響パラメータに大きく依存しており、音響パラメータは超音波検査者、機械、設定によって異なります。
ドメイン全体にわたる US 画像の一般化可能性を向上させるために、解剖学的特徴表現とドメイン特徴表現を明示的に解きほぐす新しい相互情報量 (MI) ベースのフレームワークである MI-SegNet を提案します。
したがって、堅牢なドメインに依存しないセグメンテーションが期待できます。
もつれを解くために関連する特徴を抽出するために 2 つのエンコーダーが使用されます。
セグメンテーションでは、予測に解剖学的特徴マップのみが使用されます。
エンコーダに意味のある特徴表現を強制的に学習させるために、トレーニング中にクロス再構成手法が使用されます。
ドメインまたは解剖学的構造のいずれかに固有の変換は、それぞれの特徴抽出タスクでエンコーダーをガイドするために適用されます。
さらに、両方の特徴マップに存在する MI は、別々の特徴空間をさらに促進するために罰せられます。
提案されているドメインに依存しないセグメンテーション アプローチの一般化可能性を、パラメーターとマシンが異なる複数のデータセットで検証します。
さらに、提案した MI-SegNet が事前学習済みモデルとして機能することの有効性を、最先端のネットワークと比較することで実証します。

要約(オリジナル)

Generalization capabilities of learning-based medical image segmentation across domains are currently limited by the performance degradation caused by the domain shift, particularly for ultrasound (US) imaging. The quality of US images heavily relies on carefully tuned acoustic parameters, which vary across sonographers, machines, and settings. To improve the generalizability on US images across domains, we propose MI-SegNet, a novel mutual information (MI) based framework to explicitly disentangle the anatomical and domain feature representations; therefore, robust domain-independent segmentation can be expected. Two encoders are employed to extract the relevant features for the disentanglement. The segmentation only uses the anatomical feature map for its prediction. In order to force the encoders to learn meaningful feature representations a cross-reconstruction method is used during training. Transformations, specific to either domain or anatomy are applied to guide the encoders in their respective feature extraction task. Additionally, any MI present in both feature maps is punished to further promote separate feature spaces. We validate the generalizability of the proposed domain-independent segmentation approach on several datasets with varying parameters and machines. Furthermore, we demonstrate the effectiveness of the proposed MI-SegNet serving as a pre-trained model by comparing it with state-of-the-art networks.

arxiv情報

著者 Yuan Bi,Zhongliang Jiang,Ricarda Clarenbach,Reza Ghotbi,Angelos Karlas,Nassir Navab
発行日 2024-02-06 16:55:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク