SimLVSeg: Simplifying Left Ventricular Segmentation in 2D+Time Echocardiograms with Self- and Weakly-Supervised Learning

要約

心エコー検査は、一般的な心臓の健康状態の評価に不可欠な臨床画像診断法となっています。
駆出率などのバイオマーカーの計算から患者の心不全の確率まで、心臓構造の正確なセグメンテーションにより、医師は心臓の状態を評価し、より正確かつ正確に治療法を考案することができます。
ただし、正確で信頼性の高い左心室セグメンテーションを達成することは、さまざまな理由から時間がかかり、困難です。
したがって、臨床医は診断を行うために、2 つの特定の心エコー図フレームで左心室 (LV) をセグメント化することに頼ることがよくあります。
結果として得られるデータセットには通常、注釈がまばらに付けられるため、手動 LV セグメンテーションではカバー範囲が限られているため、時間的一貫性の高い自動 LV セグメンテーションを開発する際に課題が生じます。
この課題に応えて、この研究では、まばらに注釈が付けられた心エコー図ビデオから一貫した LV セグメンテーションを行うビデオベースのネットワークを可能にする新しいパラダイムである SimLVSeg を導入します。
SimLVSeg は、時間的マスキングを使用した自己教師あり事前トレーニングと、それに続くスパース アノテーションからの LV セグメンテーションに合わせた弱教師あり学習で構成されます。
SimLVSeg が、より効率的でありながら、最大の 2D+時間心エコー検査データセット (EchoNet-Dynamic) で 93.32% (95%CI 93.21-93.43%) のダイス スコアを達成することで、いかに最先端のソリューションを上回るパフォーマンスを発揮するかを実証します。
SimLVSeg は、2D スーパー イメージと 3D セグメンテーションの 2 種類のビデオ セグメンテーション ネットワークと互換性があります。
私たちのアプローチの有効性を示すために、事前トレーニング設定やさまざまな深層学習バックボーンを含む広範なアブレーション研究を提供します。
さらに、目に見えない分布 (CAMUS データセット) での SimLVSeg の一般化可能性を示すために、分布外テストを実行します。
コードは https://github.com/fadamsyah/SimLVSeg で公開されています。

要約(オリジナル)

Echocardiography has become an indispensable clinical imaging modality for general heart health assessment. From calculating biomarkers such as ejection fraction to the probability of a patient’s heart failure, accurate segmentation of the heart structures allows doctors to assess the heart’s condition and devise treatments with greater precision and accuracy. However, achieving accurate and reliable left ventricle segmentation is time-consuming and challenging due to different reasons. Hence, clinicians often rely on segmenting the left ventricular (LV) in two specific echocardiogram frames to make a diagnosis. This limited coverage in manual LV segmentation poses a challenge for developing automatic LV segmentation with high temporal consistency, as the resulting dataset is typically annotated sparsely. In response to this challenge, this work introduces SimLVSeg, a novel paradigm that enables video-based networks for consistent LV segmentation from sparsely annotated echocardiogram videos. SimLVSeg consists of self-supervised pre-training with temporal masking, followed by weakly supervised learning tailored for LV segmentation from sparse annotations. We demonstrate how SimLVSeg outperforms the state-of-the-art solutions by achieving a 93.32% (95%CI 93.21-93.43%) dice score on the largest 2D+time echocardiography dataset (EchoNet-Dynamic) while being more efficient. SimLVSeg is compatible with two types of video segmentation networks: 2D super image and 3D segmentation. To show the effectiveness of our approach, we provide extensive ablation studies, including pre-training settings and various deep learning backbones. We further conduct an out-of-distribution test to showcase SimLVSeg’s generalizability on unseen distribution (CAMUS dataset). The code is publicly available at https://github.com/fadamsyah/SimLVSeg.

arxiv情報

著者 Fadillah Maani,Asim Ukaye,Nada Saadi,Numan Saeed,Mohammad Yaqub
発行日 2024-03-26 15:41:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク