Compact & Capable: Harnessing Graph Neural Networks and Edge Convolution for Medical Image Classification

要約

グラフベースのニューラル ネットワーク モデルは、他の方法では識別が困難なエンティティ間の潜在的なトポロジー関係を明らかにできるため、表現学習の分野で注目を集めています。
これらのモデルは、創薬、タンパク質相互作用、セマンティック セグメンテーション、流体力学研究など、さまざまな分野で使用されています。
この研究では、医療画像分類におけるグラフ ニューラル ネットワーク (GNN) の可能性を調査します。
GNN とエッジ畳み込みを組み合わせた新しいモデルを導入し、RGB チャネル特徴値の相互接続性を活用して、重要なグラフ ノード間の接続を強力に表現します。
私たちが提案するモデルは、最先端のディープ ニューラル ネットワーク (DNN) と同等のパフォーマンスを発揮するだけでなく、1,000 分の 1 少ないパラメーターでそれを実現し、その結果、トレーニング時間とデータ要件が削減されます。
MedMNIST データセット クラスを分類するために、グラフ畳み込みニューラル ネットワーク (GCNN) を事前トレーニングされた DNN と比較し、医用画像解析における GNN の有望な見通しを明らかにします。
私たちの結果はまた、医療画像分野におけるグラフ アテンション ネットワーク (GAT) やグラフ オート エンコーダーなどの高度なグラフベース モデルのさらなる探究を奨励します。
提案されたモデルは、より単純な GCNN と比較して、セマンティック セグメンテーションや画像分類などのタスクに対して、より信頼性が高く、解釈可能で正確な結果をもたらします。

要約(オリジナル)

Graph-based neural network models are gaining traction in the field of representation learning due to their ability to uncover latent topological relationships between entities that are otherwise challenging to identify. These models have been employed across a diverse range of domains, encompassing drug discovery, protein interactions, semantic segmentation, and fluid dynamics research. In this study, we investigate the potential of Graph Neural Networks (GNNs) for medical image classification. We introduce a novel model that combines GNNs and edge convolution, leveraging the interconnectedness of RGB channel feature values to strongly represent connections between crucial graph nodes. Our proposed model not only performs on par with state-of-the-art Deep Neural Networks (DNNs) but does so with 1000 times fewer parameters, resulting in reduced training time and data requirements. We compare our Graph Convolutional Neural Network (GCNN) to pre-trained DNNs for classifying MedMNIST dataset classes, revealing promising prospects for GNNs in medical image analysis. Our results also encourage further exploration of advanced graph-based models such as Graph Attention Networks (GAT) and Graph Auto-Encoders in the medical imaging domain. The proposed model yields more reliable, interpretable, and accurate outcomes for tasks like semantic segmentation and image classification compared to simpler GCNNs

arxiv情報

著者 Aryan Singh,Pepijn Van de Ven,Ciarán Eising,Patrick Denny
発行日 2023-07-24 13:39:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク