LV-UNet: A Lightweight and Vanilla Model for Medical Image Segmentation


大規模なモデルはコンピュータ ビジョンにおいて大幅な進歩を遂げていますが、最適化の複雑さ、トランスフォーマー アーキテクチャの複雑さ、計算上の制約、実用的なアプリケーションの要求などの課題により、医用画像のセグメンテーションにおけるよりシンプルなモデル設計の重要性が浮き彫りになっています。
このニーズは、リアルタイム パフォーマンスを備えた軽量で展開可能なモデルを必要とするモバイル医療機器で特に顕著です。
これらの課題に対処するために、このホワイト ペーパーでは、事前トレーニングされた MobileNetv3-Large バックボーンを活用し、可融モジュールを組み込んだ軽量の標準モデルである LV-UNet を紹介します。
LV-UNet は、強化されたディープ トレーニング戦略を採用し、再パラメータ化による推論中に展開モードに切り替え、パラメータ数と計算オーバーヘッドを大幅に削減します。
ISIC 2016、BUSI、CVC-ClinicDB、CVC-ColonDB、および Kvair-SEG データセットの実験結果は、パフォーマンスと計算負荷の間のより良いトレードオフを示しています。
コードは \url{} でリリースされます。


While large models have achieved significant progress in computer vision, challenges such as optimization complexity, the intricacy of transformer architectures, computational constraints, and practical application demands highlight the importance of simpler model designs in medical image segmentation. This need is particularly pronounced in mobile medical devices, which require lightweight, deployable models with real-time performance. However, existing lightweight models often suffer from poor robustness across datasets, limiting their widespread adoption. To address these challenges, this paper introduces LV-UNet, a lightweight and vanilla model that leverages pre-trained MobileNetv3-Large backbones and incorporates fusible modules. LV-UNet employs an enhanced deep training strategy and switches to a deployment mode during inference by re-parametrization, significantly reducing parameter count and computational overhead. Experimental results on ISIC 2016, BUSI, CVC-ClinicDB, CVC-ColonDB, and Kvair-SEG datasets demonstrate a better trade-off between performance and the computational load. The code will be released at \url{}.


著者 Juntao Jiang,Mengmeng Wang,Huizhong Tian,Lingbo Cheng,Yong Liu
発行日 2024-12-02 12:39:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, eess.IV パーマリンク