Topologically-Regularized Multiple Instance Learning for Red Blood Cell Disease Classification

要約

顕微鏡画像を使用してまれな貧血疾患を診断することは、熟練した専門家にとっても機械学習手法にとっても同様に困難です。
単一の血液サンプルには疾患に関連する細胞が何千も含まれているため、これは複雑な複数インスタンス学習 (MIL) 問題を構成します。
赤血球の空間的近傍自体には意味はありませんが、トポロジー、つまり血液サンプル全体の形状には、限られたデータでトレーニングする場合の勾配の消失や過剰学習などの典型的な MIL の問題を解決するための有益な特徴が含まれています。
したがって、単一の赤血球画像のバッグからマルチスケールのトポロジー特徴を抽出するトポロジーベースのアプローチを開発します。
トポロジ特徴はモデルを正規化するために使用され、データの特徴的なトポロジ特性の保持が強制されます。
521 枚の赤血球の顕微鏡画像を含む、稀な貧血疾患に苦しむ 71 人の患者のデータセットに適用された私たちの実験は、トポロジカル正則化が効果的な方法であり、
単細胞画像。
これは、MIL プロセスを正規化するためにトポロジ特性を使用する最初のアプローチです。

要約(オリジナル)

Diagnosing rare anemia disorders using microscopic images is challenging for skilled specialists and machine-learning methods alike. Due to thousands of disease-relevant cells in a single blood sample, this constitutes a complex multiple-instance learning (MIL) problem. While the spatial neighborhood of red blood cells is not meaningful per se, the topology, i.e., the geometry of blood samples as a whole, contains informative features to remedy typical MIL issues, such as vanishing gradients and overfitting when training on limited data. We thus develop a topology-based approach that extracts multi-scale topological features from bags of single red blood cell images. The topological features are used to regularize the model, enforcing the preservation of characteristic topological properties of the data. Applied to a dataset of 71 patients suffering from rare anemia disorders with 521 microscopic images of red blood cells, our experiments show that topological regularization is an effective method that leads to more than 3% performance improvements for the automated classification of rare anemia disorders based on single-cell images. This is the first approach that uses topological properties for regularizing the MIL process.

arxiv情報

著者 Salome Kazeminia,Ario Sadafi,Asya Makhro,Anna Bogdanova,Carsten Marr,Bastian Rieck
発行日 2023-07-26 08:14:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV, q-bio.QM, stat.ML パーマリンク