Red Blood Cell Segmentation with Overlapping Cell Separation and Classification on Imbalanced Dataset

要約

血液塗抹画像上の赤血球(RBC)分類を自動化することで、血液内科医は赤血球検査結果を時間とコストを抑えて分析することができます。しかし、重なり合った細胞は誤った予測結果を引き起こす可能性があるため、分類する前に複数の単一赤血球に分離する必要があります。ディープラーニングで複数のクラスを分類するためには、正常なサンプルが希少な疾患サンプルよりも常に高いため、医療画像ではアンバランスの問題がよく発生する。本論文では、血液塗抹画像から赤血球を分離して分類する新しい方法を提示し、特に細胞の重複とデータのアンバランス問題に取り組む。重なり合う細胞の分離に焦点を当て、我々のセグメンテーションプロセスは、まず赤血球を表現する楕円を推定する。本手法は、凹んだ点を検出し、有向楕円フィッティングを使用して楕円を求める。20枚の血液塗抹画像から得られた精度は0.889であった。分類にはバランスのとれたトレーニングデータセットが必要です。しかし、いくつかの赤血球の種類はまれである。このデータセットの不均衡比は、20,875個の個々の赤血球サンプルから12の赤血球クラスに対して34.538であった。したがって、アンバランスなデータセットを用いたRBC分類のための機械学習の使用は、他の多くのアプリケーションよりも困難である。我々は、この問題に対処するための技術を分析した。EfficientNet-B1(オーグメンテーション付き)を用いた場合、最高の精度とF1スコアはそれぞれ0.921と0.8679であった。実験の結果、オーグメンテーションを用いたウェイトバランシング技術は、少数クラスのF1スコアを向上させることで不均衡問題に対処する可能性があり、データオーグメンテーションは全体の分類性能を大幅に向上させることがわかった。

要約(オリジナル)

Automated red blood cell (RBC) classification on blood smear images helps hematologists to analyze RBC lab results in a reduced time and cost. However, overlapping cells can cause incorrect predicted results, and so they have to be separated into multiple single RBCs before classifying. To classify multiple classes with deep learning, imbalance problems are common in medical imaging because normal samples are always higher than rare disease samples. This paper presents a new method to segment and classify RBCs from blood smear images, specifically to tackle cell overlapping and data imbalance problems. Focusing on overlapping cell separation, our segmentation process first estimates ellipses to represent RBCs. The method detects the concave points and then finds the ellipses using directed ellipse fitting. The accuracy from 20 blood smear images was 0.889. Classification requires balanced training datasets. However, some RBC types are rare. The imbalance ratio of this dataset was 34.538 for 12 RBC classes from 20,875 individual RBC samples. The use of machine learning for RBC classification with an imbalanced dataset is hence more challenging than many other applications. We analyzed techniques to deal with this problem. The best accuracy and F1-score were 0.921 and 0.8679, respectively, using EfficientNet-B1 with augmentation. Experimental results showed that the weight balancing technique with augmentation had the potential to deal with imbalance problems by improving the F1-score on minority classes, while data augmentation significantly improved the overall classification performance.

arxiv情報

著者 Korranat Naruenatthanaset,Thanarat H. Chalidabhongse,Duangdao Palasuwan,Nantheera Anantrasirichai,Attakorn Palasuwan
発行日 2023-03-06 10:41:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク