Deep Gaussian mixture model for unsupervised image segmentation

要約

最近のディープ ラーニングの出現により、教師ありディープ セマンティック セグメンテーション アルゴリズムの設計に多大な労力が費やされています。
多くのタスクでは、十分なピクセル レベルのラベルを取得することが非常に難しいため、混合ガウス モデル (GMM) と教師なし深層学習技術を組み合わせた方法を提案します。
標準 GMM では、各サブ領域のピクセル値はガウス分布によってモデル化されます。
異なる領域を識別するには、GMM に関する負の対数尤度 (NLL) 関数を最小化するパラメーター ベクトルを近似する必要があります。
このタスクでは、通常、期待値最大化 (EM) アルゴリズムなどの反復最適化手法が使用されます。
この論文では、畳み込みニューラル ネットワーク (CNN) を使用して画像からこれらのパラメーターを直接推定することを提案します。
したがって、EM アルゴリズムの反復手順を変更し、ネットワーク パラメーターに関して期待ステップを勾配ステップに置き換えます。
これは、ネットワークが GMM の NLL 機能を最小限に抑えるようにトレーニングされていることを意味し、これには少なくとも 2 つの利点があります。
一度トレーニングされると、ネットワークは時間のかかる反復的な最適化手法と比較して、ラベルの確率を非常に迅速に予測できます。
第二に、事前のディープ画像のおかげで、私たちの方法は、GMM の主な欠点の 1 つを部分的に克服できます。GMM は、隣接するピクセル間の独立性を前提とするため、隣接するピクセル間の相関を考慮に入れません。
我々は、マルチシーケンス MRI 画像上の心筋梗塞セグメンテーションの例に関するさまざまな実験でこの方法の利点を実証します。

要約(オリジナル)

The recent emergence of deep learning has led to a great deal of work on designing supervised deep semantic segmentation algorithms. As in many tasks sufficient pixel-level labels are very difficult to obtain, we propose a method which combines a Gaussian mixture model (GMM) with unsupervised deep learning techniques. In the standard GMM the pixel values with each sub-region are modelled by a Gaussian distribution. In order to identify the different regions, the parameter vector that minimizes the negative log-likelihood (NLL) function regarding the GMM has to be approximated. For this task, usually iterative optimization methods such as the expectation-maximization (EM) algorithm are used. In this paper, we propose to estimate these parameters directly from the image using a convolutional neural network (CNN). We thus change the iterative procedure in the EM algorithm replacing the expectation-step by a gradient-step with regard to the networks parameters. This means that the network is trained to minimize the NLL function of the GMM which comes with at least two advantages. As once trained, the network is able to predict label probabilities very quickly compared with time consuming iterative optimization methods. Secondly, due to the deep image prior our method is able to partially overcome one of the main disadvantages of GMM, which is not taking into account correlation between neighboring pixels, as it assumes independence between them. We demonstrate the advantages of our method in various experiments on the example of myocardial infarct segmentation on multi-sequence MRI images.

arxiv情報

著者 Matthias Schwab,Agnes Mayr,Markus Haltmeier
発行日 2024-04-18 15:20:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク