要約
画像分類のための深い学習の最近の進歩は、主に畳み込みニューラルネットワーク(CNNS)またはトランスベースのアーキテクチャに依存しています。
ただし、これらのモデルは、特に複雑なテクスチャの詳細とコンテキスト機能をキャプチャする際に、医療イメージングにおける顕著な課題に直面しています。
Kolmogorov-Arnold Networks(KANS)は、非線形変換モデリングを強化する新しいクラスのアーキテクチャを表し、複雑な機能を改善した表現を提供します。
この作業では、Kanとその畳み込み拡張に基づいて構築された医療画像分類フレームワークであるMedkanを提示します。
Medkanには、2つのコアモジュールが搭載されています。細粒の特徴抽出用のローカル情報Kan(lik)モジュールと、グローバルコンテキスト統合用のグローバル情報Kan(GIK)モジュールです。
これらのモジュールを組み合わせることにより、Medkanは堅牢な機能モデリングと融合を実現します。
多様な計算ニーズに対応するために、Medkan-S、Medkan-B、およびMedkan-Lの3つのスケーラブルなバリアントを紹介します。
9つの公共医療画像データセットの実験結果は、MedkanがCNNおよび変圧器ベースのモデルと比較して優れた性能を達成し、医療画像分析におけるその有効性と一般化可能性を強調することを示しています。
要約(オリジナル)
Recent advancements in deep learning for image classification predominantly rely on convolutional neural networks (CNNs) or Transformer-based architectures. However, these models face notable challenges in medical imaging, particularly in capturing intricate texture details and contextual features. Kolmogorov-Arnold Networks (KANs) represent a novel class of architectures that enhance nonlinear transformation modeling, offering improved representation of complex features. In this work, we present MedKAN, a medical image classification framework built upon KAN and its convolutional extensions. MedKAN features two core modules: the Local Information KAN (LIK) module for fine-grained feature extraction and the Global Information KAN (GIK) module for global context integration. By combining these modules, MedKAN achieves robust feature modeling and fusion. To address diverse computational needs, we introduce three scalable variants–MedKAN-S, MedKAN-B, and MedKAN-L. Experimental results on nine public medical imaging datasets demonstrate that MedKAN achieves superior performance compared to CNN- and Transformer-based models, highlighting its effectiveness and generalizability in medical image analysis.
arxiv情報
著者 | Zhuoqin Yang,Jiansong Zhang,Xiaoling Luo,Zheng Lu,Linlin Shen |
発行日 | 2025-02-25 18:12:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google