要約
効率的な医用画像セグメンテーションは、軽量の実装フレームワークを使用して、医用画像の正確なピクセル単位の予測を提供することを目的としています。
しかし、軽量フレームワークは一般に高性能を達成できず、クロスドメインタスクでの一般化能力が低いという問題があります。この論文では、クロスドメイン医用画像のロバストで効率的なセグメンテーションのための一般化可能な知識蒸留法を提案します。
主に、モデル固有のアライメントネットワーク(MSAN)を提案して、事前トレーニング済みのセマンティックオートエンコーダー(P-SAE)によって正規化されたドメイン不変の表現を提供します。
一方、カスタマイズされたAlignment Consistency Training(ACT)戦略は、MSANトレーニングを促進するように設計されています。
MSANのドメイン不変の代表的なベクトルを使用して、2つの一般化可能な知識蒸留スキーム、デュアルコントラストグラフ蒸留(DCGD)とドメイン不変クロス蒸留(DICD)を提案します。
具体的には、DCGDでは、データ分布の観点から、結合内および結合間の意味相関を表すために、2種類の暗黙的な対照グラフが設計されています。
DICDでは、2つのモデル(つまり、教師と学生)からのドメイン不変のセマンティックベクトルを利用して、MSANのヘッダー交換によって機能を相互再構築します。これにより、学生モデルのエンコーダーとデコーダーの両方で一般化可能な改善が実現します。
さらに、Fr \’echet Semantic Distance(FSD)という名前のメトリックは、正規化されたドメイン不変機能の有効性を検証するように調整されています。
肝臓と網膜血管のセグメンテーションデータセットで実施された広範な実験は、軽量フレームワークでのパフォーマンスと一般化の観点から、私たちの方法の優先順位を示しています。
要約(オリジナル)
Efficient medical image segmentation aims to provide accurate pixel-wise prediction for the medical images with the lightweight implementation framework. However, lightweight frameworks generally fail to achieve high performance, and suffer from the poor generalizable ability on cross-domain tasks.In this paper, we propose a generalizable knowledge distillation method for robust and efficient segmentation of cross-domain medical images. Primarily, we propose the Model-Specific Alignment Networks (MSAN) to provide the domain-invariant representations which are regularized by a Pre-trained Semantic AutoEncoder (P-SAE). Meanwhile, a customized Alignment Consistency Training (ACT) strategy is designed to promote the MSAN training. With the domain-invariant representative vectors in MSAN, we propose two generalizable knowledge distillation schemes, Dual Contrastive Graph Distillation (DCGD) and Domain-Invariant Cross Distillation (DICD). Specifically, in DCGD, two types of implicit contrastive graphs are designed to represent the intra-coupling and inter-coupling semantic correlations from the perspective of data distribution. In DICD, the domain-invariant semantic vectors from the two models (i.e., teacher and student) are leveraged to cross-reconstruct features by the header exchange of MSAN, which achieves generalizable improvement for both the encoder and decoder in the student model. Furthermore, a metric named Fr\’echet Semantic Distance (FSD) is tailored to verify the effectiveness of the regularized domain-invariant features. Extensive experiments conducted on the Liver and Retinal Vessel Segmentation datasets demonstrate the priority of our method, in terms of performance and generalization on lightweight frameworks.
arxiv情報
著者 | Xingqun Qi,Zhuojie Wu,Min Ren,Muyi Sun,Zhenan Sun |
発行日 | 2022-07-26 15:55:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google