RGMIM: Region-Guided Masked Image Modeling for COVID-19 Detection

要約

タイトル:COVID-19検出のための領域ガイド付きマスク画像モデリング(RGMIM)

要約:この論文では、自己教師あり学習を用いたCOVID-19の診断において、マスク画像モデリング(MIM)と呼ばれる手法を提案している。MIMは、入力ピクセルの一部をマスクし、マスクされたピクセルを予測することを目的とする自己教師あり学習手法の一つである。しかし、従来のMIMではランダムなマスキング手法が用いられており、医療画像では疾患を検出するための小さな領域があるため、その問題を解決する必要がある。本研究では、COVID-19の検出において、新しい領域ガイド付きマスク画像モデリング(RGMIM)手法を提案する。この手法では、肺マスク情報を用いて有効な領域を特定し、より有用な情報を学習する新しいマスキング手法を考案している。定量的な評価実験を通じて、RGMIMが他の自己教師あり学習手法よりも優れた性能を発揮することが示された。特に、トレーニングデータの少ない場合において、RGMIMが最高の性能を発揮することが確認された。

要点:
– 自己教師あり学習手法であるマスク画像モデリング(MIM)を用いてCOVID-19の診断に取り組む。
– 従来のMIMではランダムなマスキング手法が用いられており、医療画像では疾患を検出するための小さな領域があるため、新しい手法が必要とされている。
– 新しい手法として、領域ガイド付きマスク画像モデリング(RGMIM)を提案する。
– RGMIMでは肺マスク情報を用いて有効な領域を特定し、より有用な情報を学習するマスキング手法を考案している。
– 定量的な評価実験を通じて、RGMIMが他の自己教師あり学習手法よりも優れた性能を発揮することが示された。
– 特に、トレーニングデータの少ない場合において、RGMIMが最高の性能を発揮することが確認された。

要約(オリジナル)

Background and objective: Self-supervised learning is rapidly advancing computer-aided diagnosis in the medical field. Masked image modeling (MIM) is one of the self-supervised learning methods that masks a subset of input pixels and attempts to predict the masked pixels. Traditional MIM methods often employ a random masking strategy. In comparison to ordinary images, medical images often have a small region of interest for disease detection. Consequently, we focus on fixing the problem in this work, which is evaluated by automatic COVID-19 identification. Methods: In this study, we propose a novel region-guided masked image modeling method (RGMIM) for COVID-19 detection in this paper. In our method, we devise a new masking strategy that employed lung mask information to identify valid regions to learn more useful information for COVID-19 detection. The proposed method was contrasted with five self-supervised learning techniques (MAE, SKD, Cross, BYOL, and, SimSiam). We present a quantitative evaluation of open COVID-19 CXR datasets as well as masking ratio hyperparameter studies. Results: When using the entire training set, RGMIM outperformed other comparable methods, achieving 0.962 detection accuracy. Specifically, RGMIM significantly improved COVID-19 detection in small data volumes, such as 5% and 10% of the training set (846 and 1,693 images) compared to other methods, and achieved 0.957 detection accuracy even when only 50% of the training set was used. Conclusions: RGMIM can mask more valid lung-related regions, facilitating the learning of discriminative representations and the subsequent high-accuracy COVID-19 detection. RGMIM outperforms other state-of-the-art self-supervised learning methods in experiments, particularly when limited training data is used.

arxiv情報

著者 Guang Li,Ren Togo,Takahiro Ogawa,Miki Haseyama
発行日 2023-04-20 10:06:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク