要約
組織学的腫瘍標本における有糸分裂像の認識は、患者の転帰評価に非常に関連しています。
このタスクは、画像表現の変化によりアルゴリズムのパフォーマンスが低下するため、アルゴリズムにとっても人間の専門家にとっても同様に困難です。
異なる種類の腫瘍に対して評価が実行される場合、異なるデジタル化デバイスを使用して画像が取得される場合、または異なる研究室で標本が作成される場合、かなりの共変量シフトが発生します。
この観察は、有糸分裂ドメインの一般化に関する 2022 年の課題 (MIDOG 2022) の開始の動機となりました。
このチャレンジでは、6 つの異なるドメインからの注釈付きの組織学的腫瘍画像が提供され、10 個の独立したドメインについて 9 人のチャレンジ参加者によって提供された有糸分裂像検出のアルゴリズム アプローチが評価されました。
有糸分裂像検出のグランドトゥルースは、3 人の専門家のコンセンサスと、独立した免疫組織化学支援によるラベルのセットという 2 つの方法で確立されました。
この研究は、課題タスク、参加者が採用したアルゴリズム戦略、および参加者の成功に寄与する潜在的な要因の概要を表します。
最高成績のチームの $F_1$ スコアは 0.764 で、今日の深層学習ベースの認識パイプラインを使用すれば、さまざまな腫瘍ドメインにわたるドメインの一般化が可能であると要約されます。
ただし、トレーニング セットに存在しないドメイン特性 (新しい種としてのネコ科動物、新しい形態としての紡錘体細胞の形状、および新しいスキャナー) が、小さいながらもパフォーマンスの大幅な低下につながることもわかりました。
免疫組織化学支援参照標準と比較して評価した場合、すべての方法で再現スコアが低下しましたが、ランキングにおける参加者の順序の変化はわずかでした。
要約(オリジナル)
Recognition of mitotic figures in histologic tumor specimens is highly relevant to patient outcome assessment. This task is challenging for algorithms and human experts alike, with deterioration of algorithmic performance under shifts in image representations. Considerable covariate shifts occur when assessment is performed on different tumor types, images are acquired using different digitization devices, or specimens are produced in different laboratories. This observation motivated the inception of the 2022 challenge on MItosis Domain Generalization (MIDOG 2022). The challenge provided annotated histologic tumor images from six different domains and evaluated the algorithmic approaches for mitotic figure detection provided by nine challenge participants on ten independent domains. Ground truth for mitotic figure detection was established in two ways: a three-expert consensus and an independent, immunohistochemistry-assisted set of labels. This work represents an overview of the challenge tasks, the algorithmic strategies employed by the participants, and potential factors contributing to their success. With an $F_1$ score of 0.764 for the top-performing team, we summarize that domain generalization across various tumor domains is possible with today’s deep learning-based recognition pipelines. However, we also found that domain characteristics not present in the training set (feline as new species, spindle cell shape as new morphology and a new scanner) led to small but significant decreases in performance. When assessed against the immunohistochemistry-assisted reference standard, all methods resulted in reduced recall scores, but with only minor changes in the order of participants in the ranking.
arxiv情報
著者 | Marc Aubreville,Nikolas Stathonikos,Taryn A. Donovan,Robert Klopfleisch,Jonathan Ganz,Jonas Ammeling,Frauke Wilm,Mitko Veta,Samir Jabari,Markus Eckstein,Jonas Annuscheit,Christian Krumnow,Engin Bozaba,Sercan Cayir,Hongyan Gu,Xiang ‘Anthony’ Chen,Mostafa Jahanifar,Adam Shephard,Satoshi Kondo,Satoshi Kasai,Sujatha Kotte,VG Saipradeep,Maxime W. Lafarge,Viktor H. Koelzer,Ziyue Wang,Yongbing Zhang,Sen Yang,Xiyue Wang,Katharina Breininger,Christof A. Bertram |
発行日 | 2024-01-31 13:19:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google