要約
コンピューティング能力の向上に伴い、血液が正常に凝固できない稀な疾患である血友病などの医療診断や検査を支援するために、医療画像処理における機械学習モデルが導入されています。
多くの場合、血友病検出のボトルネックの 1 つは、アルゴリズムをトレーニングして精度を高めるために利用できるデータが不足していることです。
この研究では、考えられる解決策として、データ合成による拡張データの導入と従来の拡張技術の導入がモデルの精度を向上させ、疾患の診断に役立つかどうかを調査しました。
この研究に取り組むために、事前に訓練された VGG-16 によって超音波画像の特徴が抽出され、実際の画像、合成画像、および拡張画像の間のさまざまな分布における抽出された特徴に基づくコサイン類似度測定によって類似性が比較されました (本物と本物)
、Syn vs. Syn、Real vs. Syn の異なるバッチ、Real vs. Augmentation Technique)。
EffientNet-B4 を使用して、2 つの拡張方法で「血液」画像を認識するモデル テストのパフォーマンスが調査されました。
さらに、精度の低下などの予期しない結果を解釈するために、勾配加重クラス アクティベーション マッピング (Grad-CAM) 視覚化が使用されました。
合成画像と実際の画像は高い類似性を示さず、平均類似性スコアは 0.4737 です。
合成バッチ 1 データセットと水平反転による画像は、元の画像により似ています。
従来の拡張技術とデータ合成によりモデルの精度を向上させることができ、従来の拡張技術によるデータは合成データよりも優れたパフォーマンスを発揮します。
さらに、Grad-CAM ヒートマップは、精度の低下がドメインのシフトによるものであることを突き止めました。
全体として、この研究では、データ合成と従来の拡張技術という 2 つの拡張方法が、両方とも精度をある程度向上させ、希少疾患の診断に役立つことがわかりました。
要約(オリジナル)
With the increase of computing power, machine learning models in medical imaging have been introduced to help in rending medical diagnosis and inspection, like hemophilia, a rare disorder in which blood cannot clot normally. Often, one of the bottlenecks of detecting hemophilia is the lack of data available to train the algorithm to increase the accuracy. As a possible solution, this research investigated whether introducing augmented data by data synthesis or traditional augmentation techniques can improve model accuracy, helping to diagnose the diseases. To tackle this research, features of ultrasound images were extracted by the pre-trained VGG-16, and similarities were compared by cosine similarity measure based on extracted features in different distributions among real images, synthetic images, and augmentation images (Real vs. Real, Syn vs. Syn, Real vs. Different Batches of Syn, Real vs. Augmentation Techniques). Model testing performance was investigated using EffientNet-B4 to recognize ‘blood’ images with two augmentation methods. In addition, a gradient-weighted class activation mapping (Grad-CAM) visualization was used to interpret the unexpected results like loss of accuracy. Synthetic and real images do not show high similarity, with a mean similarity score of 0.4737. Synthetic batch 1 dataset and images by horizontal flip are more similar to the original images. Classic augmentation techniques and data synthesis can improve model accuracy, and data by traditional augmentation techniques have a better performance than synthetic data. In addition, the Grad-CAM heatmap figured out the loss of accuracy is due to a shift in the domain. Overall, this research found that two augmentation methods, data synthesis and traditional augmentation techniques, both can improve accuracy to a certain extent to help to diagnose rare diseases.
arxiv情報
著者 | Qianyu Fan |
発行日 | 2024-09-18 15:17:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google