要約
ヘマトキシリンおよびエオシン (H&E) で染色したスライドで観察される有糸分裂像 (MF) の数は、腫瘍細胞増殖の尺度となるため、重要な予後マーカーです。
ただし、MF の識別には評価者間の一致度が低いことが知られています。
深層学習アルゴリズムはこのタスクを標準化できますが、トレーニングと検証には大量の注釈付きデータが必要です。
さらに、アノテーション プロセス中に導入されるラベル ノイズがアルゴリズムのパフォーマンスを妨げる可能性があります。
H&E とは異なり、有糸分裂特異的抗体ホスホヒストン H3 (PHH3) は MF を特異的に強調します。
PHH3 に対して染色されたスライド上の MF をカウントすると、評価者間の一致度が高くなるため、最近では H&E における MF の注釈の基準として使用されています。
ただし、PHH3 は H&E 染色単独と区別できない細胞の認識を容易にするため、このグランド トゥルースの使用により、H&E 関連のデータセットにノイズが導入され、モデルのパフォーマンスに影響を与える可能性があります。
この研究では、大規模な複数評価者実験を通じて、PHH3 支援の MF アノテーションが評価者間信頼性とオブジェクト レベルの一致に及ぼす影響を分析します。
PHH3 支援ラベリングを使用すると、アノテーターのオブジェクトレベルの一致が増加することがわかりました。
続いて、モデルのパフォーマンスに対する PHH3 支援標識の影響を調査するために、結果として得られたデータセットに対して MF 検出器が評価されました。
さらに、H&E で使用される PHH3 支援ラベルの解釈の変化を調査するために、新しい二重染色 MF 検出器が開発されました。これは、単一染色検出器を明らかに上回りました。
ただし、PHH3 支援ラベルは、H&E ベースのモデルのみにはプラスの効果をもたらしませんでした。
当社のデュアル入力検出器の高性能により、この効果の原因として、H&E 染色画像と PHH3 染色画像の間の情報の不一致が明らかになりました。
要約(オリジナル)
The count of mitotic figures (MFs) observed in hematoxylin and eosin (H&E)-stained slides is an important prognostic marker as it is a measure for tumor cell proliferation. However, the identification of MFs has a known low inter-rater agreement. Deep learning algorithms can standardize this task, but they require large amounts of annotated data for training and validation. Furthermore, label noise introduced during the annotation process may impede the algorithm’s performance. Unlike H&E, the mitosis-specific antibody phospho-histone H3 (PHH3) specifically highlights MFs. Counting MFs on slides stained against PHH3 leads to higher agreement among raters and has therefore recently been used as a ground truth for the annotation of MFs in H&E. However, as PHH3 facilitates the recognition of cells indistinguishable from H&E stain alone, the use of this ground truth could potentially introduce noise into the H&E-related dataset, impacting model performance. This study analyzes the impact of PHH3-assisted MF annotation on inter-rater reliability and object level agreement through an extensive multi-rater experiment. We found that the annotators’ object-level agreement increased when using PHH3-assisted labeling. Subsequently, MF detectors were evaluated on the resulting datasets to investigate the influence of PHH3-assisted labeling on the models’ performance. Additionally, a novel dual-stain MF detector was developed to investigate the interpretation-shift of PHH3-assisted labels used in H&E, which clearly outperformed single-stain detectors. However, the PHH3-assisted labels did not have a positive effect on solely H&E-based models. The high performance of our dual-input detector reveals an information mismatch between the H&E and PHH3-stained images as the cause of this effect.
arxiv情報
著者 | Jonathan Ganz,Christian Marzahl,Jonas Ammeling,Barbara Richter,Chloé Puget,Daniela Denk,Elena A. Demeter,Flaviu A. Tabaran,Gabriel Wasinger,Karoline Lipnik,Marco Tecilla,Matthew J. Valentine,Michael J. Dark,Niklas Abele,Pompei Bolfa,Ramona Erber,Robert Klopfleisch,Sophie Merz,Taryn A. Donovan,Samir Jabari,Christof A. Bertram,Katharina Breininger,Marc Aubreville |
発行日 | 2024-06-28 13:07:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google