Deep Learning for Medical Image Segmentation: Tricks, Challenges and Future Directions

要約

ここ数年、コンピューター ビジョン向けのディープ ラーニング テクノロジの急速な発展により、医療画像セグメンテーション (MedISeg) のパフォーマンスが大幅に向上しました。
ただし、最近の MedISeg の出版物は通常、主な貢献 (ネットワーク アーキテクチャ、トレーニング戦略、損失関数など) のプレゼンテーションに焦点を当てていますが、いくつかの重要な実装の詳細 (「トリック」とも呼ばれます) を無意識のうちに無視しています。
不公平な実験結果の比較。
このホワイト ペーパーでは、さまざまなモデル実装フェーズ (つまり、事前トレーニング モデル、データ前処理、データ拡張、モデル実装、モデル推論、および結果後処理) の一連の MedISeg トリックを収集し、その有効性を実験的に調査します。
一貫したベースライン モデルでのこれらのトリックの。
セグメンテーション モデルの利点と制限の分析のみに淡々と焦点を当てた紙ベースの調査と比較して、私たちの作業は多数の確かな実験を提供し、技術的により操作可能です。
代表的な 2D および 3D 医用画像データセットの両方に関する広範な実験結果により、これらのトリックの効果を明示的に明らかにします。
さらに、調査したトリックに基づいて、強力な MedISeg リポジトリもオープンソース化しました。このリポジトリの各コンポーネントには、プラグ アンド プレイの利点があります。
この画期的な作業は、最先端の MedISeg アプローチの包括的かつ補完的な調査を完了するだけでなく、将来の医療画像処理の課題に対処するための実用的なガイドも提供すると考えています。
不均衡学習、マルチモダリティ学習、およびドメイン適応。
コードは https://github.com/hust-linyi/MedISeg で公開されています。

要約(オリジナル)

Over the past few years, the rapid development of deep learning technologies for computer vision has greatly promoted the performance of medical image segmentation (MedISeg). However, the recent MedISeg publications usually focus on presentations of the major contributions (e.g., network architectures, training strategies, and loss functions) while unwittingly ignoring some marginal implementation details (also known as ‘tricks’), leading to a potential problem of the unfair experimental result comparisons. In this paper, we collect a series of MedISeg tricks for different model implementation phases (i.e., pre-training model, data pre-processing, data augmentation, model implementation, model inference, and result post-processing), and experimentally explore the effectiveness of these tricks on the consistent baseline models. Compared to paper-driven surveys that only blandly focus on the advantages and limitation analyses of segmentation models, our work provides a large number of solid experiments and is more technically operable. With the extensive experimental results on both the representative 2D and 3D medical image datasets, we explicitly clarify the effect of these tricks. Moreover, based on the surveyed tricks, we also open-sourced a strong MedISeg repository, where each of its components has the advantage of plug-and-play. We believe that this milestone work not only completes a comprehensive and complementary survey of the state-of-the-art MedISeg approaches, but also offers a practical guide for addressing the future medical image processing challenges including but not limited to small dataset learning, class imbalance learning, multi-modality learning, and domain adaptation. The code has been released at: https://github.com/hust-linyi/MedISeg

arxiv情報

著者 Dong Zhang,Yi Lin,Hao Chen,Zhuotao Tian,Xin Yang,Jinhui Tang,Kwang Ting Cheng
発行日 2022-09-21 12:30:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク