Human-AI Collaborative Multi-modal Multi-rater Learning for Endometriosis Diagnosis

要約

子宮内膜症は、出生時に女性として割り当てられた人の約 10% に罹患しており、診断と管理が困難です。
診断には通常、腹腔鏡手術または T1/T2 MRI 画像の分析を使用して病気のさまざまな兆候を特定することが含まれます。後者はより迅速かつ安価ですが、精度が低くなります。
子宮内膜症の重要な診断兆候は、ダグラス嚢 (POD) の消失です。
しかし、経験豊富な臨床医でも、MRI 画像から POD 消失を正確に分類するのは困難であり、信頼できる AI モデルのトレーニングが複雑になります。
この論文では、上記の課題に対処するために、Human-AI Collaborative Multi-modal Multi-rater Learning (HAICOMM) 方法論を紹介します。
HAICOMM は、この問題の 3 つの重要な側面を調査する最初の方法です。1) トレーニング サンプルごとに利用可能な複数の「ノイズのある」ラベルからよりクリーンなラベルを抽出するマルチ評価者学習。
2) トレーニングとテストに T1/T2 MRI 画像の存在を活用するマルチモーダル学習。
3) 人間と AI のコラボレーションにより、臨床医と AI モデルからの予測を活用するシステムを構築し、スタンドアロンの臨床医と AI モデルよりも正確な分類を提供します。
私たちの方法論を検証するために収集した複数評価者の T1/T2 MRI 子宮内膜症データセットに関する結果を提示すると、提案された HAICOMM モデルは、臨床医のアンサンブル、ノイズのあるラベルの学習モデル、および複数評価者の学習方法よりも優れたパフォーマンスを発揮します。

要約(オリジナル)

Endometriosis, affecting about 10% of individuals assigned female at birth, is challenging to diagnose and manage. Diagnosis typically involves the identification of various signs of the disease using either laparoscopic surgery or the analysis of T1/T2 MRI images, with the latter being quicker and cheaper but less accurate. A key diagnostic sign of endometriosis is the obliteration of the Pouch of Douglas (POD). However, even experienced clinicians struggle with accurately classifying POD obliteration from MRI images, which complicates the training of reliable AI models. In this paper, we introduce the Human-AI Collaborative Multi-modal Multi-rater Learning (HAICOMM) methodology to address the challenge above. HAICOMM is the first method that explores three important aspects of this problem: 1) multi-rater learning to extract a cleaner label from the multiple ‘noisy’ labels available per training sample; 2) multi-modal learning to leverage the presence of T1/T2 MRI images for training and testing; and 3) human-AI collaboration to build a system that leverages the predictions from clinicians and the AI model to provide more accurate classification than standalone clinicians and AI models. Presenting results on the multi-rater T1/T2 MRI endometriosis dataset that we collected to validate our methodology, the proposed HAICOMM model outperforms an ensemble of clinicians, noisy-label learning models, and multi-rater learning methods.

arxiv情報

著者 Hu Wang,David Butler,Yuan Zhang,Jodie Avery,Steven Knox,Congbo Ma,Louise Hull,Gustavo Carneiro
発行日 2024-10-25 10:46:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク