Deep Learning for Classification of Inflammatory Bowel Disease Activity in Whole Slide Images of Colonic Histopathology

要約

標準化された病理組織学的スコアリング システムを使用して炎症性腸疾患 (IBD) 活動性を格付けすることは、リソースの制約と観察者間のばらつきのため、依然として困難です。
この研究では、IBD 患者のヘマトキシリンおよびエオシン染色された全スライド画像 (WSI) の活動グレードを分類する深層学習モデルを開発し、一般の病理学者に堅牢なアプローチを提供しました。
我々は、2018年と2019年にダートマス・ヒッチコック医療センターで治療を受けた636人の患者から採取した2,077個のWSIを利用し、倍率40倍(0.25ミクロン/ピクセル)でスキャンした。
学会認定の消化器病理学者は、WSI を非活動性、軽度活動性、中等度活動性、重度活動性の 4 つの活動クラスに分類しました。
トランスフォーマーベースのモデルが開発され、IBD 活動を分類するために 5 分割交差検証を使用して検証されました。
HoVerNet を使用して、活動グレード全体の好中球の分布を調べました。
私たちのモデルからのアテンション マップは、その予測に寄与する領域を強調表示しました。
このモデルは、曲線下面積の加重平均 0.871 [95% 信頼区間 (CI): 0.860-0.883]、精度の 0.695 [95% CI: 0.674-0.715]、0.697 [95% CI: 0.678] で IBD 活動性を分類しました。
リコールは -0.716]、F1 スコアは 0.695 [95% CI: 0.674-0.714]。
好中球の分布は活動クラスによって大きく異なりました。
消化器病理学者によるアテンションマップの定性的評価により、解釈可能性が向上する可能性が示唆されました。
私たちのモデルは堅牢な診断パフォーマンスを実証し、IBD 活動性評価の一貫性と効率を向上させることができます。

要約(オリジナル)

Grading inflammatory bowel disease (IBD) activity using standardized histopathological scoring systems remains challenging due to resource constraints and inter-observer variability. In this study, we developed a deep learning model to classify activity grades in hematoxylin and eosin-stained whole slide images (WSIs) from patients with IBD, offering a robust approach for general pathologists. We utilized 2,077 WSIs from 636 patients treated at Dartmouth-Hitchcock Medical Center in 2018 and 2019, scanned at 40x magnification (0.25 micron/pixel). Board-certified gastrointestinal pathologists categorized the WSIs into four activity classes: inactive, mildly active, moderately active, and severely active. A transformer-based model was developed and validated using five-fold cross-validation to classify IBD activity. Using HoVerNet, we examined neutrophil distribution across activity grades. Attention maps from our model highlighted areas contributing to its prediction. The model classified IBD activity with weighted averages of 0.871 [95% Confidence Interval (CI): 0.860-0.883] for the area under the curve, 0.695 [95% CI: 0.674-0.715] for precision, 0.697 [95% CI: 0.678-0.716] for recall, and 0.695 [95% CI: 0.674-0.714] for F1-score. Neutrophil distribution was significantly different across activity classes. Qualitative evaluation of attention maps by a gastrointestinal pathologist suggested their potential for improved interpretability. Our model demonstrates robust diagnostic performance and could enhance consistency and efficiency in IBD activity assessment.

arxiv情報

著者 Amit Das,Tanmay Shukla,Naofumi Tomita,Ryland Richards,Laura Vidis,Bing Ren,Saeed Hassanpour
発行日 2024-10-25 17:00:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク