要約
大規模な医用画像データセットの利用が可能になってきている。これらのデータセットに共通する課題は、各サンプルが重大なアーティファクトを含まない最低限の品質要件を満たしていることを確認することです。医用画像における不完全性やアーティファクトを識別するために、既存の自動化された方法が幅広く開発されてきたにもかかわらず、それらのほとんどはデータを大量に消費する方法に依存している。特に、学習に利用できるアーティファクトを含む十分なスキャンがないことが、臨床研究における機械学習の設計と展開の障害となっている。この問題に取り組むため、我々は4つの主要な構成要素を持つ新しいフレームワークを提案する。(1)磁気共鳴物理学に着想を得たアーティファクト生成器、(2)画像をコンパクトに表現するための抽象的かつ工学的な特徴量、(3)アーティファクトのクラスに応じて分類性能を高める特徴選択、(4)アーティファクト識別用に学習したサポートベクターマシンの分類器、である。まず、物理学に基づくアーチファクト生成器を用いて、アーチファクトを制御した合成脳MRIスキャンを生成し、データ補強の手法として利用することである。これにより、稀なアーティファクトを持つスキャンを収集し、ラベリングするという労力のかかるプロセスを回避することができる。次に、構造的MRIの9種類のアーティファクトを識別するために開発された、抽象的かつ工学的な画像特徴の大規模なプールを提案する。最後に、アーティファクトに基づく特徴選択ブロックを用いて、アーティファクトの各クラスについて、最良の分類性能を提供する特徴のセットを見つける。人工的にアーティファクトを生成したスキャンを含む大規模なデータセットと、専門家によって実際のアーティファクトが識別された多発性硬化症の臨床試験で検証実験を行い、提案するパイプラインが従来の手法よりも優れていることを示す。
要約(オリジナル)
Large medical imaging data sets are becoming increasingly available. A common challenge in these data sets is to ensure that each sample meets minimum quality requirements devoid of significant artefacts. Despite a wide range of existing automatic methods having been developed to identify imperfections and artefacts in medical imaging, they mostly rely on data-hungry methods. In particular, the lack of sufficient scans with artefacts available for training has created a barrier in designing and deploying machine learning in clinical research. To tackle this problem, we propose a novel framework having four main components: (1) a set of artefact generators inspired by magnetic resonance physics to corrupt brain MRI scans and augment a training dataset, (2) a set of abstract and engineered features to represent images compactly, (3) a feature selection process that depends on the class of artefact to improve classification performance, and (4) a set of Support Vector Machine (SVM) classifiers trained to identify artefacts. Our novel contributions are threefold: first, we use the novel physics-based artefact generators to generate synthetic brain MRI scans with controlled artefacts as a data augmentation technique. This will avoid the labour-intensive collection and labelling process of scans with rare artefacts. Second, we propose a large pool of abstract and engineered image features developed to identify 9 different artefacts for structural MRI. Finally, we use an artefact-based feature selection block that, for each class of artefacts, finds the set of features that provide the best classification performance. We performed validation experiments on a large data set of scans with artificially-generated artefacts, and in a multiple sclerosis clinical trial where real artefacts were identified by experts, showing that the proposed pipeline outperforms traditional methods.
arxiv情報
著者 | Daniele Ravi,Frederik Barkhof,Daniel C. Alexander,Geoffrey JM Parker,Arman Eshaghi |
発行日 | 2022-06-07 14:53:35+00:00 |
arxivサイト | arxiv_id(pdf) |