Annotating 8,000 Abdominal CT Volumes for Multi-Organ Segmentation in Three Weeks

要約

医療画像、特に臓器のセグメンテーションに対する注釈付けは、手間と時間がかかります。
たとえば、腹部臓器にアノテーションを付けるには、アノテーターの専門知識、臓器のサイズ、可視性、複雑さに基づいて、CT ボリュームあたり 30 ~ 60 分の推定時間が必要です。
したがって、多臓器セグメンテーション用に公開されているデータセットは、データ サイズと臓器の多様性が制限されていることがよくあります。
この論文では、臓器セグメンテーションのアノテーションプロセスを迅速化する体系的かつ効率的な方法を提案します。
私たちは、8,448 CT ボリューム (320 万スライスに相当) にアノテーションが付けられた、脾臓、肝臓、腎臓、胃、胆嚢、膵臓、大動脈、IVC を含む (これまでで最大の) 多臓器データセットを作成しました。
従来のアノテーション方法では、経験豊富なアノテーターがこのタスクを完了するまでに最大 1,600 週間 (または約 30.8 年) かかります。
対照的に、私たちのアノテーション方法は、同等かそれ以上のアノテーション品質を維持しながら、このタスクを 3 週間 (週 5 日、1 日 8 時間労働に基づく) で達成しました。
この成果は、私たちの方法の 3 つの独自の特性によるものです。(1) 複数の事前トレーニング済みセグメンテーション モデルを使用したラベル バイアスの低減、(2) モデル予測における効果的なエラー検出、(3) アノテーターがラベルを修正するための注意ガイダンス
最も顕著なエラー。
さらに、AI アルゴリズムとアノテーターによって発生する一般的なエラーの分類を要約します。
これにより、AI とアノテーションの両方を継続的に改良することが可能になり、さまざまな医用画像タスクのための大規模なデータセットの作成に必要なアノテーションのコストが大幅に削減されます。

要約(オリジナル)

Annotating medical images, particularly for organ segmentation, is laborious and time-consuming. For example, annotating an abdominal organ requires an estimated rate of 30-60 minutes per CT volume based on the expertise of an annotator and the size, visibility, and complexity of the organ. Therefore, publicly available datasets for multi-organ segmentation are often limited in data size and organ diversity. This paper proposes a systematic and efficient method to expedite the annotation process for organ segmentation. We have created the largest multi-organ dataset (by far) with the spleen, liver, kidneys, stomach, gallbladder, pancreas, aorta, and IVC annotated in 8,448 CT volumes, equating to 3.2 million slices. The conventional annotation methods would take an experienced annotator up to 1,600 weeks (or roughly 30.8 years) to complete this task. In contrast, our annotation method has accomplished this task in three weeks (based on an 8-hour workday, five days a week) while maintaining a similar or even better annotation quality. This achievement is attributed to three unique properties of our method: (1) label bias reduction using multiple pre-trained segmentation models, (2) effective error detection in the model predictions, and (3) attention guidance for annotators to make corrections on the most salient errors. Furthermore, we summarize the taxonomy of common errors made by AI algorithms and annotators. This allows for continuous refinement of both AI and annotations and significantly reduces the annotation costs required to create large-scale datasets for a wider variety of medical imaging tasks.

arxiv情報

著者 Chongyu Qu,Tiezheng Zhang,Hualin Qiao,Jie Liu,Yucheng Tang,Alan Yuille,Zongwei Zhou
発行日 2023-05-16 17:59:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク