要約
コンピューター断層撮影スキャンにおける肝血管は、画像の断片化やノイズ干渉を受けることが多く、血管の完全性を維持することが困難になり、血管のセグメンテーションに重大な課題をもたらします。
この問題に対処するために、私たちは革新的なモデル SegKAN を提案します。
まず、画像埋め込みに新しい畳み込みネットワーク構造を採用することで、従来の埋め込みモジュールを改良します。これにより、画像ノイズが平滑化され、後続の段階での勾配爆発などの問題が防止されます。
次に、Patch ブロック間の空間的関係を時間的関係に変換して、従来の Vision Transformer モデルにおける Patch ブロック間の位置関係を捉える問題を解決します。
肝血管データセットで実験を行ったところ、既存の最先端モデルと比較して、Dice スコアが 1.78% 向上しました。
これらの結果は、提案された新しい構造が高解像度の拡張オブジェクトのセグメンテーション パフォーマンスを効果的に強化することを示しています。
コードは https://github.com/goblin327/SegKAN で入手できます。
要約(オリジナル)
Hepatic vessels in computed tomography scans often suffer from image fragmentation and noise interference, making it difficult to maintain vessel integrity and posing significant challenges for vessel segmentation. To address this issue, we propose an innovative model: SegKAN. First, we improve the conventional embedding module by adopting a novel convolutional network structure for image embedding, which smooths out image noise and prevents issues such as gradient explosion in subsequent stages. Next, we transform the spatial relationships between Patch blocks into temporal relationships to solve the problem of capturing positional relationships between Patch blocks in traditional Vision Transformer models. We conducted experiments on a Hepatic vessel dataset, and compared to the existing state-of-the-art model, the Dice score improved by 1.78%. These results demonstrate that the proposed new structure effectively enhances the segmentation performance of high-resolution extended objects. Code will be available at https://github.com/goblin327/SegKAN
arxiv情報
著者 | Shengbo Tan,Rundong Xue,Shipeng Luo,Zeyu Zhang,Xinran Wang,Lei Zhang,Daji Ergu,Zhang Yi,Yang Zhao,Ying Cai |
発行日 | 2025-01-02 17:25:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google