Informing selection of performance metrics for medical image segmentation evaluation using configurable synthetic errors

要約

医用画像における機械学習ベースのセグメンテーションは、診断から放射線治療計画まで、臨床アプリケーションで広く使用されています。
グラウンド トゥルースを使用したセグメント化された医用画像は、さまざまなセグメンテーション パフォーマンス メトリックのプロパティを調査して、メトリックの選択を通知するのに役立ちます。
通常の幾何学的形状は、セグメンテーション エラーを合成し、パフォーマンス メトリックのプロパティを示すためによく使用されますが、実際の画像の解剖学的なバリエーションの複雑さを欠いています。
この研究では、実際の医用画像から抽出された解剖学的オブジェクトの参照 (真実) マスクを調整することにより、セグメンテーションをエミュレートするツールを提示します。
私たちのツールは、定義された真実の輪郭を変更し、ユーザーが構成可能な一連のパラメーターを使用してさまざまなタイプのセグメンテーション エラーをエミュレートするように設計されています。
放射線治療用グリオーマ画像セグメンテーション (GLIS-RT) データベースの 230 の患者画像からグラウンド トゥルース オブジェクトを定義しました。
オブジェクトごとに、セグメンテーション合成ツールを使用して、10 バージョンのセグメンテーション (つまり、10 個のシミュレートされたセグメンターまたはアルゴリズム) を合成しました。各バージョンには、事前に定義されたセグメンテーション エラーの組み合わせがあります。
次に、20 のパフォーマンス メトリクスを適用して、すべての合成セグメンテーションを評価しました。
特定の種類のセグメンテーション エラーをキャプチャする機能など、これらのメトリックのプロパティを示しました。
これらのメトリックの本質的な特性を分析し、セグメンテーション エラーを分類することにより、セグメンテーション パフォーマンス メトリックの選択を支援するための決定木ツールを開発するという目標に向かって取り組んでいます。

要約(オリジナル)

Machine learning-based segmentation in medical imaging is widely used in clinical applications from diagnostics to radiotherapy treatment planning. Segmented medical images with ground truth are useful for investigating the properties of different segmentation performance metrics to inform metric selection. Regular geometrical shapes are often used to synthesize segmentation errors and illustrate properties of performance metrics, but they lack the complexity of anatomical variations in real images. In this study, we present a tool to emulate segmentations by adjusting the reference (truth) masks of anatomical objects extracted from real medical images. Our tool is designed to modify the defined truth contours and emulate different types of segmentation errors with a set of user-configurable parameters. We defined the ground truth objects from 230 patient images in the Glioma Image Segmentation for Radiotherapy (GLIS-RT) database. For each object, we used our segmentation synthesis tool to synthesize 10 versions of segmentation (i.e., 10 simulated segmentors or algorithms), where each version has a pre-defined combination of segmentation errors. We then applied 20 performance metrics to evaluate all synthetic segmentations. We demonstrated the properties of these metrics, including their ability to capture specific types of segmentation errors. By analyzing the intrinsic properties of these metrics and categorizing the segmentation errors, we are working toward the goal of developing a decision-tree tool for assisting in the selection of segmentation performance metrics.

arxiv情報

著者 Shuyue Guan,Ravi K. Samala,Weijie Chen
発行日 2022-12-30 17:13:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク