Detecting Shortcuts in Medical Images — A Case Study in Chest X-rays

要約

大規模な公開データセットの利用可能性と計算能力の向上により、医学界の関心は高性能なアルゴリズムに移っている。しかし、データの質やそのアノテーションにはほとんど注意が払われていない。ベンチマークデータにおける高い性能は、データ中のショートカットやアーチファクトの可能性を考慮せずに報告されることがあり、さらに、モデルは部分集団でテストされることはない。この研究では、ショートカットの問題に対する認識を高めることを目的としている。我々はこれまでの知見を検証し、2つの一般に利用可能なデータセットを用いた胸部X線に関するケーススタディを提示する。また、ドレーン付きの気胸の画像のサブセットに対するアノテーションを共有する。最後に、医用画像分類のための一般的な推奨事項を述べる。

要約(オリジナル)

The availability of large public datasets and the increased amount of computing power have shifted the interest of the medical community to high-performance algorithms. However, little attention is paid to the quality of the data and their annotations. High performance on benchmark datasets may be reported without considering possible shortcuts or artifacts in the data, besides, models are not tested on subpopulation groups. With this work, we aim to raise awareness about shortcuts problems. We validate previous findings, and present a case study on chest X-rays using two publicly available datasets. We share annotations for a subset of pneumothorax images with drains. We conclude with general recommendations for medical image classification.

arxiv情報

著者 Amelia Jiménez-Sánchez,Dovile Juodelyte,Bethany Chamberlain,Veronika Cheplygina
発行日 2022-11-09 12:06:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク