特に肝臓のセグメンテーションにおいて、腫瘍の正確かつ効率的な 3D 識別に対するニーズの高まりにより、深層学習モデルに関する多大な研究が促進されています。
このペーパーでは、これらの課題に対処するために設計されたコルモゴロフ・アーノルド・ネットワーク (KAN) の進歩的なスタッキング手法である proKAN を紹介します。
従来のアーキテクチャとは異なり、proKAN は、過学習動作に基づいてトレーニング中に KAN ブロックを段階的に追加することで、その複雑さを動的に調整します。
さらに、proKAN は、B スプラインを通じてモデル化された KAN の学習可能な活性化関数を利用しており、これにより、3D 医療データ内の複雑な関係を学習する際の柔軟性が向上します。
私たちが提案するアーキテクチャは、肝臓セグメンテーション タスクにおいて最先端のパフォーマンスを実現し、標準的な多層パーセプトロン (MLP) や固定 KAN アーキテクチャを上回ります。
proKAN の動的な性質により、過剰学習のリスクなしに、効率的なトレーニング時間と高い精度が保証されます。
さらに、proKAN は、学習可能な係数を通じて意思決定プロセスを洞察できるようにすることで、より優れた解釈可能性を提供します。
実験結果は、精度、ダイス スコア、時間効率が大幅に向上したことを示しており、proKAN が 3D 医用画像セグメンテーション タスクにとって魅力的なソリューションとなっています。
The growing need for accurate and efficient 3D identification of tumors, particularly in liver segmentation, has spurred considerable research into deep learning models. While many existing architectures offer strong performance, they often face challenges such as overfitting and excessive computational costs. An adjustable and flexible architecture that strikes a balance between time efficiency and model complexity remains an unmet requirement. In this paper, we introduce proKAN, a progressive stacking methodology for Kolmogorov-Arnold Networks (KANs) designed to address these challenges. Unlike traditional architectures, proKAN dynamically adjusts its complexity by progressively adding KAN blocks during training, based on overfitting behavior. This approach allows the network to stop growing when overfitting is detected, preventing unnecessary computational overhead while maintaining high accuracy. Additionally, proKAN utilizes KAN’s learnable activation functions modeled through B-splines, which provide enhanced flexibility in learning complex relationships in 3D medical data. Our proposed architecture achieves state-of-the-art performance in liver segmentation tasks, outperforming standard Multi-Layer Perceptrons (MLPs) and fixed KAN architectures. The dynamic nature of proKAN ensures efficient training times and high accuracy without the risk of overfitting. Furthermore, proKAN provides better interpretability by allowing insight into the decision-making process through its learnable coefficients. The experimental results demonstrate a significant improvement in accuracy, Dice score, and time efficiency, making proKAN a compelling solution for 3D medical image segmentation tasks.
著者 | Bhavesh Gyanchandani,Aditya Oza,Abhinav Roy |
発行日 | 2024-12-27 16:14:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google