Subgraph Clustering and Atom Learning for Improved Image Classification

要約

この研究では、特徴抽出のための畳み込みニューラル ネットワーク (CNN) と構造モデリングのためのグラフ ニューラル ネットワーク (GNN) の長所を統合した新しいハイブリッド画像分類モデルであるグラフ サブグラフ ネットワーク (GSN) を紹介します。
GSN は、K-means クラスタリングを採用してグラフ ノードをクラスターにグループ化し、サブグラフの作成を容易にします。
これらのサブグラフは、辞書学習用の代表的な「アトム」を学習するために利用され、まばらなクラス識別可能な特徴の識別を可能にします。
この統合されたアプローチは、正確な分類のために微妙な特徴の違いを識別することが重要である医療画像処理などの分野に特に関連しています。
提案した GSN のパフォーマンスを評価するために、PascalVOC や HAM10000 などのベンチマーク データセットで実験を実施しました。
私たちの結果は、さまざまなクラスにわたって辞書構成を最適化する際のモデルの有効性を示しており、これが医療分類タスクにおける有効性に貢献しています。
このパフォーマンスの向上は主に、CNN、GNN、およびグラフ学習技術の統合によるもので、これらの技術が集合的に、限られたラベル付きサンプルを含むデータセットの処理を改善します。
具体的には、私たちの実験では、このモデルが従来の CNN アプローチと比較して、Pascal VOC や HAM10000 などのベンチマーク データセットで高い精度を達成していることが示されています。

要約(オリジナル)

In this study, we present the Graph Sub-Graph Network (GSN), a novel hybrid image classification model merging the strengths of Convolutional Neural Networks (CNNs) for feature extraction and Graph Neural Networks (GNNs) for structural modeling. GSN employs k-means clustering to group graph nodes into clusters, facilitating the creation of subgraphs. These subgraphs are then utilized to learn representative `atoms` for dictionary learning, enabling the identification of sparse, class-distinguishable features. This integrated approach is particularly relevant in domains like medical imaging, where discerning subtle feature differences is crucial for accurate classification. To evaluate the performance of our proposed GSN, we conducted experiments on benchmark datasets, including PascalVOC and HAM10000. Our results demonstrate the efficacy of our model in optimizing dictionary configurations across varied classes, which contributes to its effectiveness in medical classification tasks. This performance enhancement is primarily attributed to the integration of CNNs, GNNs, and graph learning techniques, which collectively improve the handling of datasets with limited labeled examples. Specifically, our experiments show that the model achieves a higher accuracy on benchmark datasets such as Pascal VOC and HAM10000 compared to conventional CNN approaches.

arxiv情報

著者 Aryan Singh,Pepijn Van de Ven,Ciarán Eising,Patrick Denny
発行日 2024-09-30 15:08:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク