Attri-VAE: attribute-based interpretable representations of medical images with variational autoencoders

要約

解釈可能性がモデルの一部として本質的に考慮される深層学習 (DL) メソッドは、臨床および画像ベースの属性と DL アウトカムとの関係をよりよく理解するために必要であり、したがって、医学的決定の背後にある推論での使用を容易にします。
変分オートエンコーダー (VAE) で構築された潜在空間表現は、データ属性の個別制御を保証しません。
属性のもつれを解く属性ベースの方法は、ベンチマーク データの古典的なコンピューター ビジョン タスクの文献で提案されています。
この論文では、VAEアプローチであるAttri-VAEを提案します。これには、生成された潜在空間で臨床および医療画像属性を異なる正則化された次元に関連付けるための属性正則化用語が含まれており、属性のより良い解釈を可能にします。
さらに、生成されたアテンション マップは、正則化された潜在空間次元での属性エンコーディングを説明しました。
Attri-VAE アプローチを使用して、健康な心筋梗塞患者を臨床、心臓の形態、およびラジオミクス属性で分析しました。
提案されたモデルは、再構成の忠実度、もつれの解消、および解釈可能性の間で優れたトレードオフを提供し、いくつかの定量的指標によると最先端の VAE アプローチよりも優れていました。
結果として得られる潜在空間により、2 つの異なる入力サンプル間の軌跡、または特定の属性次元に沿った現実的な合成データを生成して、異なる心臓状態間の変化をより適切に解釈することができました。

要約(オリジナル)

Deep learning (DL) methods where interpretability is intrinsically considered as part of the model are required to better understand the relationship of clinical and imaging-based attributes with DL outcomes, thus facilitating their use in the reasoning behind medical decisions. Latent space representations built with variational autoencoders (VAE) do not ensure individual control of data attributes. Attribute-based methods enforcing attribute disentanglement have been proposed in the literature for classical computer vision tasks in benchmark data. In this paper, we propose a VAE approach, the Attri-VAE, that includes an attribute regularization term to associate clinical and medical imaging attributes with different regularized dimensions in the generated latent space, enabling a better-disentangled interpretation of the attributes. Furthermore, the generated attention maps explained the attribute encoding in the regularized latent space dimensions. Using the Attri-VAE approach we analyzed healthy and myocardial infarction patients with clinical, cardiac morphology, and radiomics attributes. The proposed model provided an excellent trade-off between reconstruction fidelity, disentanglement, and interpretability, outperforming state-of-the-art VAE approaches according to several quantitative metrics. The resulting latent space allowed the generation of realistic synthetic data in the trajectory between two distinct input samples or along a specific attribute dimension to better interpret changes between different cardiac conditions.

arxiv情報

著者 Irem Cetin,Maialen Stephens,Oscar Camara,Miguel Angel Gonzalez Ballester
発行日 2022-12-12 16:23:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク