Machine learning identification of maternal inflammatory response and histologic choroamnionitis from placental membrane whole slide images

要約

胎盤は妊娠、分娩、出産を通して感染に対する重要なバリアーを形成している。胎盤における炎症過程は、短期的、長期的に子孫の健康に影響を及ぼす。デジタル病理学と機械学習は、胎盤の炎症を理解する上で重要な役割を果たすことができるが、母体の炎症反応(MIR)を予測・理解する方法に関する研究はほとんど行われていない。この研究では、全スライド画像(WSI)に基づいてMIRを理解するために機械学習を使用する可能性を調査し、初期のベンチマークを確立することを意図している。そのために、3つの特徴抽出器を用いたMultiple Instance Learningフレームワークを用いる:ImageNetベースのEfficientNet-v2s、2つの病理組織基盤モデルUNIとPhikonを用い、病理組織WSIからのMIRステージの予測可能性を調査する。また、これらのモデルから学習されたアテンションマップを用いて、これらのモデルからの予測を解釈する。また、白血球数(WBC)と最高発熱温度($T_{max}$)の予測にもMILフレームワークを用いる。注意に基づくMILモデルは、最大0.772のコーエンのカッパ($kappa$)で、最大88.5%のバランスのとれた精度でMIRを分類できる。さらに、病理基盤モデル(UNIとPhikon)は、ImageNetベースの特徴抽出器(EfficientNet-v2s)と比較して、バランスのとれた精度と$kappa$で高い性能を達成できることがわかった。WBCと$T_{max}$の予測では、実際の値と病理組織学的WSIから予測された値の間に穏やかな相関が見られた。WSIからMIRステージを予測するためにMILフレームワークを用い、特徴抽出器としての基礎モデルの有効性をImageNetベースのモデルと比較した。さらに、モデルの失敗例を調査した結果、観察者間のばらつきが生じやすいエッジケース、病理医の行き過ぎた例、あるいは処理エラーによる誤ラベルのいずれかであることがわかった。

要約(オリジナル)

The placenta forms a critical barrier to infection through pregnancy, labor and, delivery. Inflammatory processes in the placenta have short-term, and long-term consequences for offspring health. Digital pathology and machine learning can play an important role in understanding placental inflammation, and there have been very few investigations into methods for predicting and understanding Maternal Inflammatory Response (MIR). This work intends to investigate the potential of using machine learning to understand MIR based on whole slide images (WSI), and establish early benchmarks. To that end, we use Multiple Instance Learning framework with 3 feature extractors: ImageNet-based EfficientNet-v2s, and 2 histopathology foundation models, UNI and Phikon to investigate predictability of MIR stage from histopathology WSIs. We also interpret predictions from these models using the learned attention maps from these models. We also use the MIL framework for predicting white blood cells count (WBC) and maximum fever temperature ($T_{max}$). Attention-based MIL models are able to classify MIR with a balanced accuracy of up to 88.5% with a Cohen’s Kappa ($\kappa$) of up to 0.772. Furthermore, we found that the pathology foundation models (UNI and Phikon) are both able to achieve higher performance with balanced accuracy and $\kappa$, compared to ImageNet-based feature extractor (EfficientNet-v2s). For WBC and $T_{max}$ prediction, we found mild correlation between actual values and those predicted from histopathology WSIs. We used MIL framework for predicting MIR stage from WSIs, and compared effectiveness of foundation models as feature extractors, with that of an ImageNet-based model. We further investigated model failure cases and found them to be either edge cases prone to interobserver variability, examples of pathologist’s overreach, or mislabeled due to processing errors.

arxiv情報

著者 Abhishek Sharma,Ramin Nateghi,Marina Ayad,Lee A. D. Cooper,Jeffery A. Goldstein
発行日 2024-11-04 18:21:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, q-bio.QM パーマリンク