Realistic Data Enrichment for Robust Image Segmentation in Histopathology

要約

病理組織学的全スライド画像 (WSI) における定量的分析のパフォーマンスが低いことは、臨床現場での大きな障害となっています。
大規模な WSI に手動でアノテーションを付けるのは、要求が厳しく時間のかかる作業であり、完全教師あり学習システムで使用した場合に期待される結果が得られる可能性は低いです。
まれに観察される疾患パターンや対象スケールの大きな違いは、従来の患者摂取ではモデル化することが困難です。
従来の方法は、画像ごとにいくつかの要素を学習するだけで済む直接的な疾患分類にフォールバックするか、大部分の観察に大きく偏った平均的な画像セグメンテーションのパフォーマンスを報告するかのどちらかでした。
幾何学的画像拡張は、平均的なケース予測の堅牢性を向上させ、限られたデータセットを強化するために一般的に使用されます。
これまでのところ、安定性を向上させるために現実的な事後分布のサンプリングを提供する方法はありません。
画像内の不均衡なオブジェクトのセグメンテーションに使用します。
したがって、拡散モデルに基づいた新しいアプローチを提案します。これは、セグメンテーション マップで条件付けすることにより、過小評価されているグループからのもっともらしい例で不均衡なデータセットを充実させることができます。
私たちの方法は、限られた臨床データセットを拡張するだけで、機械学習パイプラインのトレーニングに適したものにすることができ、人間の専門家にとって本物の画像と見分けがつかない病理組織画像を生成する、解釈可能かつ人間が制御可能な方法を提供します。
私たちは 2 つのデータセット (パブリック ドメインからのデータセットと腎移植研究からのデータセット) で結果を検証します。

要約(オリジナル)

Poor performance of quantitative analysis in histopathological Whole Slide Images (WSI) has been a significant obstacle in clinical practice. Annotating large-scale WSIs manually is a demanding and time-consuming task, unlikely to yield the expected results when used for fully supervised learning systems. Rarely observed disease patterns and large differences in object scales are difficult to model through conventional patient intake. Prior methods either fall back to direct disease classification, which only requires learning a few factors per image, or report on average image segmentation performance, which is highly biased towards majority observations. Geometric image augmentation is commonly used to improve robustness for average case predictions and to enrich limited datasets. So far no method provided sampling of a realistic posterior distribution to improve stability, e.g. for the segmentation of imbalanced objects within images. Therefore, we propose a new approach, based on diffusion models, which can enrich an imbalanced dataset with plausible examples from underrepresented groups by conditioning on segmentation maps. Our method can simply expand limited clinical datasets making them suitable to train machine learning pipelines, and provides an interpretable and human-controllable way of generating histopathology images that are indistinguishable from real ones to human experts. We validate our findings on two datasets, one from the public domain and one from a Kidney Transplant study.

arxiv情報

著者 Sarah Cechnicka,James Ball,Hadrien Reynaud,Callum Arthurs,Candice Roufosse,Bernhard Kainz
発行日 2023-08-07 13:00:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク