要約
3D CTスキャンにおけるリンパ節サイズの正確な評価は、がんの病期分類、治療管理、および監視治療反応に不可欠です。
医療画像における既存の最先端のセグメンテーションフレームワークは、しばしば完全に注釈付きのデータセットに依存しています。
ただし、リンパ節セグメンテーションの場合、これらのデータセットは通常、3D CTスキャンで多数のリンパ節に注釈を付けるために必要な広範な時間と専門知識のために小さいです。
不完全または騒々しい注釈を活用する弱く監視された学習は、最近、潜在的な解決策として医療イメージングコミュニティに関心を集めています。
提案されているさまざまな弱く監視された手法にもかかわらず、ほとんどはプライベートデータセットまたは公開されている小さなデータセットでのみ検証されています。
この制限に対処するために、縦隔リンパ節定量化(LNQ)チャレンジは、医療画像コンピューティングおよびコンピューター支援介入に関する第26回国際会議(Miccai 2023)と併せて組織されました。
この課題は、新しい部分的に注釈付きのデータセットと堅牢な評価フレームワークを提供することにより、弱く監視されたセグメンテーション方法を進めることを目的としています。
5か国から合計16のチームが予測を検証リーダーボードに提出し、3か国の6チームが評価段階に参加しました。
結果は、弱く監視されたアプローチの可能性と現在の制限の両方を強調しました。
一方では、弱く監視されているアプローチは、61.0ドルの中央値スコアで比較的良好なパフォーマンスを獲得しました。
一方、中央値DICEスコアが70ドル\%$を超えるトップランクのチームは、小さくても完全に注釈付きのデータセットを活用して、弱い監督と完全な監督を組み合わせて、パフォーマンスを向上させました。
これは、弱く監視された方法の約束と、より高いセグメンテーションパフォーマンスを実現するために、高品質で完全に注釈されたデータの継続的な必要性の両方を強調しています。
要約(オリジナル)
Accurate assessment of lymph node size in 3D CT scans is crucial for cancer staging, therapeutic management, and monitoring treatment response. Existing state-of-the-art segmentation frameworks in medical imaging often rely on fully annotated datasets. However, for lymph node segmentation, these datasets are typically small due to the extensive time and expertise required to annotate the numerous lymph nodes in 3D CT scans. Weakly-supervised learning, which leverages incomplete or noisy annotations, has recently gained interest in the medical imaging community as a potential solution. Despite the variety of weakly-supervised techniques proposed, most have been validated only on private datasets or small publicly available datasets. To address this limitation, the Mediastinal Lymph Node Quantification (LNQ) challenge was organized in conjunction with the 26th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2023). This challenge aimed to advance weakly-supervised segmentation methods by providing a new, partially annotated dataset and a robust evaluation framework. A total of 16 teams from 5 countries submitted predictions to the validation leaderboard, and 6 teams from 3 countries participated in the evaluation phase. The results highlighted both the potential and the current limitations of weakly-supervised approaches. On one hand, weakly-supervised approaches obtained relatively good performance with a median Dice score of $61.0\%$. On the other hand, top-ranked teams, with a median Dice score exceeding $70\%$, boosted their performance by leveraging smaller but fully annotated datasets to combine weak supervision and full supervision. This highlights both the promise of weakly-supervised methods and the ongoing need for high-quality, fully annotated data to achieve higher segmentation performance.
arxiv情報
著者 | Reuben Dorent,Roya Khajavi,Tagwa Idris,Erik Ziegler,Bhanusupriya Somarouthu,Heather Jacene,Ann LaCasce,Jonathan Deissler,Jan Ehrhardt,Sofija Engelson,Stefan M. Fischer,Yun Gu,Heinz Handels,Satoshi Kasai,Satoshi Kondo,Klaus Maier-Hein,Julia A. Schnabel,Guotai Wang,Litingyu Wang,Tassilo Wald,Guang-Zhong Yang,Hanxiao Zhang,Minghui Zhang,Steve Pieper,Gordon Harris,Ron Kikinis,Tina Kapur |
発行日 | 2025-02-05 16:46:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google