Connecting the Dots: Graph Neural Network Powered Ensemble and Classification of Medical Images

要約

深層学習モデルは、医療画像の分野を含む、さまざまなコンピューター ビジョン タスクで顕著な結果を実証しています。
ただし、大量のトレーニング データが必要なため、医療分野での応用は限られており、取得するのが困難で費用もかかる場合があります。
これを軽減するために、事前トレーニングされたモデルはドメイン固有のデータに基づいて微調整されていますが、そのようなアプローチは帰納的バイアスの影響を受ける可能性があります。
さらに、畳み込み演算ではすべてのピクセルが平等に扱われるため、深層学習モデルは空間的に離れた特徴とその重要性との関係を学習するのに苦労します。
この課題に対する新しい解決策の先駆者として、私たちは画像フォレスト変換を採用して、画像をスーパーピクセルに最適にセグメント化します。
これらのスーパーピクセルはその後グラフ構造データに変換され、グラフ ニューラル ネットワーク (GNN) を使用した特徴の適切な抽出と関係のモデリングが可能になります。
私たちの手法は、3 つの異なる GNN アーキテクチャのアンサンブルを利用して、堅牢性を高めます。
肺炎の分類を対象とした評価では、パラメータ数を大幅に削減しながら、当社の方法論はパフォーマンスにおいて一般的なディープ ニューラル ネットワーク (DNN) を上回りました。
これにより、データに関連する費用が削減されるだけでなく、トレーニングが加速され、バイアスが最小限に抑えられます。
その結果、私たちの提案は、医療画像分類のための堅牢で経済的に実行可能でスケーラブルな戦略を提供し、広範なトレーニング データセットへの依存を大幅に軽減します。

要約(オリジナル)

Deep learning models have demonstrated remarkable results for various computer vision tasks, including the realm of medical imaging. However, their application in the medical domain is limited due to the requirement for large amounts of training data, which can be both challenging and expensive to obtain. To mitigate this, pre-trained models have been fine-tuned on domain-specific data, but such an approach can suffer from inductive biases. Furthermore, deep learning models struggle to learn the relationship between spatially distant features and their importance, as convolution operations treat all pixels equally. Pioneering a novel solution to this challenge, we employ the Image Foresting Transform to optimally segment images into superpixels. These superpixels are subsequently transformed into graph-structured data, enabling the proficient extraction of features and modeling of relationships using Graph Neural Networks (GNNs). Our method harnesses an ensemble of three distinct GNN architectures to boost its robustness. In our evaluations targeting pneumonia classification, our methodology surpassed prevailing Deep Neural Networks (DNNs) in performance, all while drastically cutting down on the parameter count. This not only trims down the expenses tied to data but also accelerates training and minimizes bias. Consequently, our proposition offers a sturdy, economically viable, and scalable strategy for medical image classification, significantly diminishing dependency on extensive training data sets.

arxiv情報

著者 Aryan Singh,Pepijn Van de Ven,Ciarán Eising,Patrick Denny
発行日 2023-11-13 13:20:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク