Label Dropout: Improved Deep Learning Echocardiography Segmentation Using Multiple Datasets With Domain Shift and Partial Labelling

要約

心エコー検査(エコー)は、心臓機能を評価する際に使用される最初の画像診断法です。
エコーからの機能的バイオマーカーの測定は心臓構造のセグメンテーションに依存しており、セグメンテーションプロセスを自動化する深層学習モデルが提案されています。
ただし、これらのツールを臨床で広く使用できるようにするには、セグメンテーション モデルがさまざまな画像 (たとえば、さまざまなスキャナーから取得したもの、さまざまなレベルの専門知識を持つオペレーターによって取得されたものなど) に対して堅牢であることが重要です。
このレベルの堅牢性を達成するには、複数の多様なデータセットを使用してモデルをトレーニングする必要があります。
複数の多様なデータセットを使用してトレーニングするときに直面する重大な課題は、ラベルの存在のばらつきです。つまり、結合されたデータは部分的にラベル付けされていることがよくあります。
部分的にラベル付けされたデータを処理するために、クロスエントロピー損失関数の適応が提案されています。
この論文では、このような損失関数と複数の多様なデータセットを使用して単純にトレーニングすると、モデルがラベルの存在をドメイン特性と関連付けてパフォーマンスの低下につながる、一種のショートカット学習につながる可能性があることを示します。
この問題に対処するために、ドメインの特性とラベルの有無との間のリンクを断つ新しいラベル ドロップアウト スキームを提案します。
複数の多様な部分的にラベル付けされたデータセットを使用してトレーニングした場合、ラベル ドロップアウトにより、2 つの心臓構造でエコー セグメンテーション ダイス スコアが 62% および 25% 改善されることを示します。

要約(オリジナル)

Echocardiography (echo) is the first imaging modality used when assessing cardiac function. The measurement of functional biomarkers from echo relies upon the segmentation of cardiac structures and deep learning models have been proposed to automate the segmentation process. However, in order to translate these tools to widespread clinical use it is important that the segmentation models are robust to a wide variety of images (e.g. acquired from different scanners, by operators with different levels of expertise etc.). To achieve this level of robustness it is necessary that the models are trained with multiple diverse datasets. A significant challenge faced when training with multiple diverse datasets is the variation in label presence, i.e. the combined data are often partially-labelled. Adaptations of the cross entropy loss function have been proposed to deal with partially labelled data. In this paper we show that training naively with such a loss function and multiple diverse datasets can lead to a form of shortcut learning, where the model associates label presence with domain characteristics, leading to a drop in performance. To address this problem, we propose a novel label dropout scheme to break the link between domain characteristics and the presence or absence of labels. We demonstrate that label dropout improves echo segmentation Dice score by 62% and 25% on two cardiac structures when training using multiple diverse partially labelled datasets.

arxiv情報

著者 Iman Islam,Esther Puyol-Antón,Bram Ruijsink,Andrew J. Reader,Andrew P. King
発行日 2024-03-12 16:57:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク