Realistic Data Enrichment for Robust Image Segmentation in Histopathology

要約

タイトル:組織病理学における頑健な画像セグメンテーションのための現実的なデータエンリッチメント

要約:

– 組織病理学における定量的解析の性能が低いため、クリニックでの実践においては重大な障害となっている。
– 大規模なWhole Slide Images(WSI)の注釈付けは、完全に教師あり学習システムに使用する場合に期待される結果を生み出すことができないため、要求が高く時間がかかる作業である。
– これまでの方法では、直接的な疾患分類に退行するか、平均画像セグメンテーションパフォーマンスに関して報告していることが多い。
– 幾何学的な画像拡張は、一般的な場合の予測の頑健性を改善し、限られたデータセットを豊富にするためによく使われる。
– 従来の方法では、現実的な事後分布のサンプリングを提供することができなかった。
– 臨床的なデータセットの拡張に適しており、解釈可能で人間が操作することのできる方法でヒストパストロジー画像を生成することができ、人間の専門家からは本物と見分けがつかない画像を提供することができる。
– ディフュージョンモデルに基づく新しいアプローチを提案しており、セグメンテーションマップに基づいて少数派グループから合理的な例を生成し、データセットを増やすことができる。
– 公共ドメインからの1つのデータセットと腎移植研究からのもう1つのデータセットで検証されている。

要約(オリジナル)

Poor performance of quantitative analysis in histopathological Whole Slide Images (WSI) has been a significant obstacle in clinical practice. Annotating large-scale WSIs manually is a demanding and time-consuming task, unlikely to yield the expected results when used for fully supervised learning systems. Rarely observed disease patterns and large differences in object scales are difficult to model through conventional patient intake. Prior methods either fall back to direct disease classification, which only requires learning a few factors per image, or report on average image segmentation performance, which is highly biased towards majority observations. Geometric image augmentation is commonly used to improve robustness for average case predictions and to enrich limited datasets. So far no method provided sampling of a realistic posterior distribution to improve stability, e.g. for the segmentation of imbalanced objects within images. Therefore, we propose a new approach, based on diffusion models, which can enrich an imbalanced dataset with plausible examples from underrepresented groups by conditioning on segmentation maps. Our method can simply expand limited clinical datasets making them suitable to train machine learning pipelines, and provides an interpretable and human-controllable way of generating histopathology images that are indistinguishable from real ones to human experts. We validate our findings on two datasets, one from the public domain and one from a Kidney Transplant study.

arxiv情報

著者 Sarah Cechnicka,James Ball,Callum Arthurs,Candice Roufosse,Bernhard Kainz
発行日 2023-04-19 09:52:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク