LNQ 2023 challenge: Benchmark of weakly-supervised techniques for mediastinal lymph node quantification

要約

3D CT スキャンによるリンパ節サイズの正確な評価は、がんの病期分類、治療管理、および治療反応のモニタリングにとって重要です。
医療画像における既存の最先端のセグメンテーション フレームワークは、多くの場合、完全に注釈が付けられたデータセットに依存しています。
ただし、リンパ節セグメンテーションの場合、3D CT スキャンで多数のリンパ節に注釈を付けるには多大な時間と専門知識が必要となるため、これらのデータセットは通常小さいです。
不完全な注釈やノイズの多い注釈を活用する弱教師あり学習は、潜在的なソリューションとして最近、医療画像コミュニティで関心を集めています。
さまざまな弱い教師付き手法が提案されているにもかかわらず、そのほとんどはプライベート データセットまたは公的に利用可能な小規模なデータセットでのみ検証されています。
この制限に対処するために、縦隔リンパ節定量化 (LNQ) チャレンジが、第 26 回医用画像コンピューティングおよびコンピューター支援介入に関する国際会議 (MICCAI 2023) と併せて開催されました。
この課題は、部分的に注釈が付けられた新しいデータセットと堅牢な評価フレームワークを提供することにより、弱教師セグメンテーション手法を進歩させることを目的としていました。
5 か国の合計 16 チームが検証リーダーボードに予測を提出し、3 か国の 6 チームが評価フェーズに参加しました。
この結果は、弱く監視されたアプローチの潜在的な限界と現在の限界の両方を浮き彫りにしました。
一方では、弱く教師付きのアプローチでは、Dice スコア中央値 $61.0\%$ という比較的良好なパフォーマンスが得られました。
一方、Dice スコアの中央値が $70\%$ を超える上位チームは、小さいながらも完全に注釈が付けられたデータセットを活用して、弱い監視と完全な監視を組み合わせることでパフォーマンスを向上させました。
これは、弱い教師付き手法の可能性と、より高いセグメンテーション パフォーマンスを達成するための高品質で完全に注釈が付けられたデータに対する継続的なニーズの両方を強調しています。

要約(オリジナル)

Accurate assessment of lymph node size in 3D CT scans is crucial for cancer staging, therapeutic management, and monitoring treatment response. Existing state-of-the-art segmentation frameworks in medical imaging often rely on fully annotated datasets. However, for lymph node segmentation, these datasets are typically small due to the extensive time and expertise required to annotate the numerous lymph nodes in 3D CT scans. Weakly-supervised learning, which leverages incomplete or noisy annotations, has recently gained interest in the medical imaging community as a potential solution. Despite the variety of weakly-supervised techniques proposed, most have been validated only on private datasets or small publicly available datasets. To address this limitation, the Mediastinal Lymph Node Quantification (LNQ) challenge was organized in conjunction with the 26th International Conference on Medical Image Computing and Computer Assisted Intervention (MICCAI 2023). This challenge aimed to advance weakly-supervised segmentation methods by providing a new, partially annotated dataset and a robust evaluation framework. A total of 16 teams from 5 countries submitted predictions to the validation leaderboard, and 6 teams from 3 countries participated in the evaluation phase. The results highlighted both the potential and the current limitations of weakly-supervised approaches. On one hand, weakly-supervised approaches obtained relatively good performance with a median Dice score of $61.0\%$. On the other hand, top-ranked teams, with a median Dice score exceeding $70\%$, boosted their performance by leveraging smaller but fully annotated datasets to combine weak supervision and full supervision. This highlights both the promise of weakly-supervised methods and the ongoing need for high-quality, fully annotated data to achieve higher segmentation performance.

arxiv情報

著者 Reuben Dorent,Roya Khajavi,Tagwa Idris,Erik Ziegler,Bhanusupriya Somarouthu,Heather Jacene,Ann LaCasce,Jonathan Deissler,Jan Ehrhardt,Sofija Engelson,Stefan M. Fischer,Yun Gu,Heinz Handels,Satoshi Kasai,Satoshi Kondo,Klaus Maier-Hein,Julia A. Schnabel,Guotai Wang,Litingyu Wang,Tassilo Wald,Guang-Zhong Yang,Hanxiao Zhang,Minghui Zhang,Steve Pieper,Gordon Harris,Ron Kikinis,Tina Kapur
発行日 2024-08-19 15:11:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク