Multi-objective point cloud autoencoders for explainable myocardial infarction prediction

要約

心筋梗塞(MI)は、世界で最も一般的な死因の 1 つです。
駆出率など、臨床で一般的に使用されている画像ベースのバイオマーカーは、心臓の 3D 解剖学的構造におけるより複雑なパターンを捉えることができないため、診断精度が制限されます。
この研究では、心臓の解剖学的構造と機能のマルチクラス 3D 点群表現に基づいて、説明可能な梗塞予測のための新しい幾何学的深層学習アプローチとして多目的点群オートエンコーダーを紹介します。
そのアーキテクチャは、低次元の潜在空間で接続された複数のタスク固有のブランチで構成されており、解釈可能な潜在空間で病理固有の 3D 形状情報をキャプチャしながら、再構成と MI 予測の両方の効果的な多目的学習を可能にします。
さらに、点群ベースの深層学習操作を備えた階層的ブランチ設計により、高解像度の解剖学的点群上で直接、効率的なマルチスケール特徴学習が可能になります。
英国の大規模なバイオバンク データセットでの実験では、多目的点群オートエンコーダーは、予測された解剖学的構造と入力された解剖学的構造の間の面取り距離が、基礎となる画像のピクセル解像度を下回る多時間 3D 形状を正確に再構築できました。
私たちの方法は、受信者動作特性曲線の下の面積の観点から、インシデント MI 予測のタスクに関して複数の機械学習および深層学習ベンチマークを 19% 上回っています。
さらに、そのタスク固有のコンパクトな潜在空間は、対象のエンコーディングと対応する 3D 形状の間の臨床的に妥当な関連性を備えた、容易に分離可能な制御クラスターと MI クラスターを示し、予測の説明可能性を示します。

要約(オリジナル)

Myocardial infarction (MI) is one of the most common causes of death in the world. Image-based biomarkers commonly used in the clinic, such as ejection fraction, fail to capture more complex patterns in the heart’s 3D anatomy and thus limit diagnostic accuracy. In this work, we present the multi-objective point cloud autoencoder as a novel geometric deep learning approach for explainable infarction prediction, based on multi-class 3D point cloud representations of cardiac anatomy and function. Its architecture consists of multiple task-specific branches connected by a low-dimensional latent space to allow for effective multi-objective learning of both reconstruction and MI prediction, while capturing pathology-specific 3D shape information in an interpretable latent space. Furthermore, its hierarchical branch design with point cloud-based deep learning operations enables efficient multi-scale feature learning directly on high-resolution anatomy point clouds. In our experiments on a large UK Biobank dataset, the multi-objective point cloud autoencoder is able to accurately reconstruct multi-temporal 3D shapes with Chamfer distances between predicted and input anatomies below the underlying images’ pixel resolution. Our method outperforms multiple machine learning and deep learning benchmarks for the task of incident MI prediction by 19% in terms of Area Under the Receiver Operating Characteristic curve. In addition, its task-specific compact latent space exhibits easily separable control and MI clusters with clinically plausible associations between subject encodings and corresponding 3D shapes, thus demonstrating the explainability of the prediction.

arxiv情報

著者 Marcel Beetz,Abhirup Banerjee,Vicente Grau
発行日 2023-07-20 16:45:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク