Unsupervised Cross-Domain Feature Extraction for Single Blood Cell Image Classification

要約

血液腫瘍の診断には、末梢血塗抹標本中の白血球の同定と分類が必要である。異なる実験手順、染色、照明、顕微鏡設定によるドメインシフトは、異なる部位から収集したデータに対する最近開発された機械学習手法の再利用性を阻害する。本論文では、末梢血塗抹標本からスキャンされた単一白血球の3つの異なるデータセットに対して、教師無しで特徴を抽出するためのクロスドメイン適応型オートエンコーダを提案する。オートエンコーダーはR-CNNアーキテクチャに基づいており、関連する白血球に焦点を当て、画像中のアーチファクトを除去することができる。抽出された特徴の質を評価するために、我々は単純なランダムフォレストを用いて単一細胞を分類した。我々は、1つのデータセットのみで学習したオートエンコーダによって抽出された豊富な特徴のおかげで、ランダムフォレスト分類器は未知のデータセットで十分な性能を発揮し、クロスドメインタスクにおいて公表されているオラクルネットワークを上回る性能を示すことを示した。この結果は、より複雑な診断や予後のタスクにおいて、高価な専門家のラベルを未見データに追加する必要なく、この教師なしアプローチを採用する可能性を示唆している。

要約(オリジナル)

Diagnosing hematological malignancies requires identification and classification of white blood cells in peripheral blood smears. Domain shifts caused by different lab procedures, staining, illumination, and microscope settings hamper the re-usability of recently developed machine learning methods on data collected from different sites. Here, we propose a cross-domain adapted autoencoder to extract features in an unsupervised manner on three different datasets of single white blood cells scanned from peripheral blood smears. The autoencoder is based on an R-CNN architecture allowing it to focus on the relevant white blood cell and eliminate artifacts in the image. To evaluate the quality of the extracted features we use a simple random forest to classify single cells. We show that thanks to the rich features extracted by the autoencoder trained on only one of the datasets, the random forest classifier performs satisfactorily on the unseen datasets, and outperforms published oracle networks in the cross-domain task. Our results suggest the possibility of employing this unsupervised approach in more complicated diagnosis and prognosis tasks without the need to add expensive expert labels to unseen data.

arxiv情報

著者 Raheleh Salehi,Ario Sadafi,Armin Gruber,Peter Lienemann,Nassir Navab,Shadi Albarqouni,Carsten Marr
発行日 2022-07-01 15:44:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク