要約
急性リンパ芽球性白血病 (ALL) は、最も一般的な種類の小児血液がんの 1 つです。
治療プロセスを迅速に開始することは患者の命を救うために非常に重要であり、そのためにはこの病気の早期診断が不可欠です。
これらの患者の血液塗抹標本を検査することは、専門の医師がこの病気を診断するために使用する方法の 1 つです。
深層学習ベースの手法は近年大幅に進歩しており、医療分野で多くの応用がなされています。
この分野では ALL 診断も例外ではなく、この問題に対する機械学習ベースの方法がいくつか提案されています。
以前の方法では、高い診断精度が報告されていましたが、私たちの研究では、モデルが近道を行ったり、意味のある決定を下せなくなったりする可能性があるため、これだけでは不十分であることがわかりました。
この問題は、医療トレーニング データセットのサイズが小さいために発生します。
これに対処するために、専門家の研究からインスピレーションを得たパイプラインに従うようにモデルを制約しました。
また、1枚の画像だけでの判断では不十分であるため、実用的な結果を得るには問題を複数インスタンスの学習問題として再定義する必要があることも示しました。
私たちのモデルは、複数インスタンスの学習セットアップにおいてこの問題に対する解決策を提供する最初のモデルです。
当社は、血液学者が使用するプロセスに近似し、疾患バイオマーカーに敏感で、精度 96.15%、F1 スコア 94.24%、感度 97.56%、特異度 90.91% を達成する、ALL 診断用の新しいパイプラインを導入しました。
私たちの方法は、分布外のデータセットでさらに評価されましたが、これは困難なテストを課しましたが、許容可能なパフォーマンスを示しました。
特に、私たちのモデルは比較的小さなデータセットでトレーニングされており、利用可能なデータが限られている他の医療データセットにも私たちのアプローチが適用できる可能性が強調されています。
要約(オリジナル)
Acute Lymphoblastic Leukemia (ALL) is one of the most common types of childhood blood cancer. The quick start of the treatment process is critical to saving the patient’s life, and for this reason, early diagnosis of this disease is essential. Examining the blood smear images of these patients is one of the methods used by expert doctors to diagnose this disease. Deep learning-based methods have numerous applications in medical fields, as they have significantly advanced in recent years. ALL diagnosis is not an exception in this field, and several machine learning-based methods for this problem have been proposed. In previous methods, high diagnostic accuracy was reported, but our work showed that this alone is not sufficient, as it can lead to models taking shortcuts and not making meaningful decisions. This issue arises due to the small size of medical training datasets. To address this, we constrained our model to follow a pipeline inspired by experts’ work. We also demonstrated that, since a judgement based on only one image is insufficient, redefining the problem as a multiple-instance learning problem is necessary for achieving a practical result. Our model is the first to provide a solution to this problem in a multiple-instance learning setup. We introduced a novel pipeline for diagnosing ALL that approximates the process used by hematologists, is sensitive to disease biomarkers, and achieves an accuracy of 96.15%, an F1-score of 94.24%, a sensitivity of 97.56%, and a specificity of 90.91% on ALL IDB 1. Our method was further evaluated on an out-of-distribution dataset, which posed a challenging test and had acceptable performance. Notably, our model was trained on a relatively small dataset, highlighting the potential for our approach to be applied to other medical datasets with limited data availability.
arxiv情報
著者 | Amirhossein Askari-Farsangi,Ali Sharifi-Zarchi,Mohammad Hossein Rohban |
発行日 | 2023-07-11 11:16:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google