T-Mamba: A unified framework with Long-Range Dependency in dual-domain for 2D & 3D Tooth Segmentation

要約

歯のセグメンテーションは、現代のデジタル歯科医療において極めて重要なステップであり、歯科矯正の診断と治療計画にわたるアプリケーションに不可欠です。
その重要性にもかかわらず、このプロセスは、2D および 3D の歯のデータに固有の高ノイズと低コントラストのため、課題を伴います。
畳み込みニューラル ネットワーク (CNN) とトランスフォーマーはどちらも医療画像のセグメンテーションで有望であることが示されていますが、それぞれの方法には長距離の依存関係と計算の複雑さを処理する際に限界があります。
この問題に対処するために、この文書では、効率的なグローバル特徴モデリングの制限に対処するために、周波数ベースの特徴と共有二位置エンコーディングをビジョン Mamba に統合する T-Mamba を紹介します。
さらに、空間領域の 2 つの特徴と周波数領域の 1 つの特徴を適応的に統合するゲート選択ユニットを設計します。
T-Mamba は、Vision Mamba に周波数ベースの機能を導入した最初の作品であり、その柔軟性により、別個のモジュールを必要とせずに 2D と 3D の両方の歯のデータを処理できます。
また、大規模な公衆歯の 2D 歯科用 X 線データセットである TED3 もこの論文で紹介されています。
広範な実験により、T-Mamba が公歯 CBCT データセットで新しい SOTA 結果を達成し、TED3 データセットで以前の SOTA 手法を上回るパフォーマンスを示したことが実証されました。
コードとモデルは、https://github.com/isbrycee/T-Mamba で公開されています。

要約(オリジナル)

Tooth segmentation is a pivotal step in modern digital dentistry, essential for applications across orthodontic diagnosis and treatment planning. Despite its importance, this process is fraught with challenges due to the high noise and low contrast inherent in 2D and 3D tooth data. Both Convolutional Neural Networks (CNNs) and Transformers has shown promise in medical image segmentation, yet each method has limitations in handling long-range dependencies and computational complexity. To address this issue, this paper introduces T-Mamba, integrating frequency-based features and shared bi-positional encoding into vision mamba to address limitations in efficient global feature modeling. Besides, we design a gate selection unit to integrate two features in spatial domain and one feature in frequency domain adaptively. T-Mamba is the first work to introduce frequency-based features into vision mamba, and its flexibility allows it to process both 2D and 3D tooth data without the need for separate modules. Also, the TED3, a large-scale public tooth 2D dental X-ray dataset, has been presented in this paper. Extensive experiments demonstrate that T-Mamba achieves new SOTA results on a public tooth CBCT dataset and outperforms previous SOTA methods on TED3 dataset. The code and models are publicly available at: https://github.com/isbrycee/T-Mamba.

arxiv情報

著者 Jing Hao,Yonghui Zhu,Lei He,Moyun Liu,James Kit Hon Tsoi,Kuo Feng Hung
発行日 2024-08-01 07:01:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク