要約
センサーのノイズ、オクルージョン、取得方法の制限などのデータの不確実性により、画像に還元できない曖昧さが生じ、その結果、さまざまではあるがもっともらしい意味論的な仮説が生じる可能性があります。
機械学習では、このあいまいさは一般に偶然の不確実性と呼ばれます。
画像セグメンテーションでは、潜在密度モデルを利用してこの問題に対処できます。
最も一般的なアプローチは、確率的 U-Net (PU-Net) です。これは、潜在正規密度を使用して、条件付きデータの対数尤度証拠下限を最適化します。
この研究では、PU-Net の潜在スペースが非常に希薄で、十分に活用されていないことを実証します。
これに対処するために、潜在空間に相互情報量の最大化とエントロピー正則化シンクホーンダイバージェンスを導入して、すべての潜在次元にわたる均一性を促進し、勾配降下法の更新と潜在空間の情報提供性を効果的に向上させます。
私たちの結果は、これをさまざまな臨床セグメンテーション問題の公開データセットに適用することにより、私たちが提案した方法論が、ユニオン上のハンガリー一致交差点での確率的セグメンテーションについて、先行する潜在変数モデルと比較して最大 11% のパフォーマンス向上を達成することを示しています。
この結果は、均一な潜在空間を促進することで、医療画像セグメンテーションの潜在密度モデリングが大幅に改善されることを示しています。
要約(オリジナル)
Data uncertainties, such as sensor noise, occlusions or limitations in the acquisition method can introduce irreducible ambiguities in images, which result in varying, yet plausible, semantic hypotheses. In Machine Learning, this ambiguity is commonly referred to as aleatoric uncertainty. In image segmentation, latent density models can be utilized to address this problem. The most popular approach is the Probabilistic U-Net (PU-Net), which uses latent Normal densities to optimize the conditional data log-likelihood Evidence Lower Bound. In this work, we demonstrate that the PU-Net latent space is severely sparse and heavily under-utilized. To address this, we introduce mutual information maximization and entropy-regularized Sinkhorn Divergence in the latent space to promote homogeneity across all latent dimensions, effectively improving gradient-descent updates and latent space informativeness. Our results show that by applying this on public datasets of various clinical segmentation problems, our proposed methodology receives up to 11% performance gains compared against preceding latent variable models for probabilistic segmentation on the Hungarian-Matched Intersection over Union. The results indicate that encouraging a homogeneous latent space significantly improves latent density modeling for medical image segmentation.
arxiv情報
著者 | M. M. Amaan Valiuddin,Christiaan G. A. Viviers,Ruud J. G. van Sloun,Peter H. N. de With,Fons van der Sommen |
発行日 | 2024-05-21 17:36:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google