要約
画像分類用の深層学習モデルでは、計算上の理由から、$224\times224$ ピクセルの解像度がよく使用されます。
この研究では、ChestX-ray14 データセットを使用して、胸部 X 線分類パフォーマンスに対する画像解像度の影響を調査します。
結果は、より高い画像解像度、具体的には $1024\times1024$ ピクセルが全体的な分類パフォーマンスに最も優れており、ほとんどの病理学的クラスで $256\times256$ から $512\times512$ ピクセルの間でパフォーマンスがわずかに低下することを示しています。
顕著性マップで生成された境界ボックスを比較すると、一般的に使用される解像度では、ほとんどの病状を検出するには不十分であることが明らかになりました。
要約(オリジナル)
Deep learning models for image classification have often used a resolution of $224\times224$ pixels for computational reasons. This study investigates the effect of image resolution on chest X-ray classification performance, using the ChestX-ray14 dataset. The results show that a higher image resolution, specifically $1024\times1024$ pixels, has the best overall classification performance, with a slight decline in performance between $256\times256$ to $512\times512$ pixels for most of the pathological classes. Comparison of saliency map-generated bounding boxes revealed that commonly used resolutions are insufficient for finding most pathologies.
arxiv情報
著者 | Alessandro Wollek,Sardi Hyska,Bastian Sabel,Michael Ingrisch,Tobias Lasser |
発行日 | 2023-06-09 17:21:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google