Ulcerative Colitis Mayo Endoscopic Scoring Classification with Active Learning and Generative Data Augmentation

要約

内視鏡画像は、潰瘍性大腸炎 (UC) を診断し、その重症度を分類するために一般的に使用されます。
深層学習ベースの方法は、これらの画像の自動分析に効果的であり、医師の支援に使用できる可能性があることが示されています。
これらの方法の可能性を最大限に発揮できるかどうかは、大量のラベル付き画像が利用できるかどうかにかかっています。
ただし、これらの画像を取得してラベルを付けることは非常に困難です。
この論文では、アクティブラーニングに基づく生成拡張手法を提案します。
この方法では、実際の内視鏡画像で構成される小さなデータセットを使用してトレーニングすることにより、多数の合成サンプルを生成します。
結果として得られるデータ プールは、アクティブ ラーニング手法を使用して絞り込まれ、最も有益なサンプルが選択され、分類器のトレーニングに使用されます。
我々は、公的に入手可能な内視鏡画像データセットを用いた実験を通じて、この方法の有効性を実証します。
結果は、アクティブ ラーニングと組み合わせて合成サンプルを使用すると、元のラベル付きサンプルのみを使用した場合と比較して分類パフォーマンスが向上し、二次加重カッパ (QWK) スコアに関して 68.1% のベースライン分類パフォーマンスが 74.5% に増加することを示しています。
もう 1 つの観察結果は、実際のデータのみを使用して同等のパフォーマンスを達成するには、3 倍の画像数が必要になるということです。

要約(オリジナル)

Endoscopic imaging is commonly used to diagnose Ulcerative Colitis (UC) and classify its severity. It has been shown that deep learning based methods are effective in automated analysis of these images and can potentially be used to aid medical doctors. Unleashing the full potential of these methods depends on the availability of large amount of labeled images; however, obtaining and labeling these images are quite challenging. In this paper, we propose a active learning based generative augmentation method. The method involves generating a large number of synthetic samples by training using a small dataset consisting of real endoscopic images. The resulting data pool is narrowed down by using active learning methods to select the most informative samples, which are then used to train a classifier. We demonstrate the effectiveness of our method through experiments on a publicly available endoscopic image dataset. The results show that using synthesized samples in conjunction with active learning leads to improved classification performance compared to using only the original labeled examples and the baseline classification performance of 68.1% increases to 74.5% in terms of Quadratic Weighted Kappa (QWK) Score. Another observation is that, attaining equivalent performance using only real data necessitated three times higher number of images.

arxiv情報

著者 Ümit Mert Çağlar,Alperen İnci,Oğuz Hanoğlu,Görkem Polat,Alptekin Temizel
発行日 2023-11-10 13:42:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV, I.2.1 パーマリンク