QIS : Interactive Segmentation via Quasi-Conformal Mappings

要約

画像セグメンテーションは、画像から重要な関心対象を抽出する上で重要な役割を果たし、さまざまなアプリケーションを可能にします。
既存の方法は、きれいな画像のセグメント化には成功していますが、ノイズやオクルージョンを含む劣化した画像を扱う場合、正確なセグメント化結果を生成するのに苦労することがよくあります。
この課題に対処するために、ユーザーがセグメンテーション プロセスをガイドするための意味のある入力を提供できる、インタラクティブ セグメンテーションが有望なアプローチとして浮上しました。
ただし、インタラクティブ セグメンテーションにおける重要な問題は、最小限だが意味のあるユーザー ガイダンスをセグメンテーション モデルに組み込む方法を決定することにあります。
この論文では、ユーザー入力を肯定的なクリックと否定的なクリックの形で組み込む、準コンフォーマル インタラクティブ セグメンテーション (QIS) モデルを提案します。
ユーザーは、オブジェクト領域に属するいくつかのピクセルを肯定的なクリックとしてマークし、セグメンテーション モデルにこれらのクリックの周囲の領域を含める必要があることを示します。
逆に、背景に属するピクセルに負のクリックが提供され、これらのクリックに近い領域をセグメンテーション マスクから除外するようにモデルに指示されます。
さらに、セグメンテーション マスクは、方向を保持する準等角マッピングを使用して、対象オブジェクトと同じトポロジを持つテンプレート マスクを変形することによって取得されます。
このアプローチは、セグメンテーション結果におけるトポロジー エラーを回避するのに役立ちます。
ユーザーの指示に基づいて関心のある領域または関心のない領域を含めたり除外したりする QIS の機能の理論的サポートを含む、提案されたモデルの徹底的な分析を提供します。
QISの性能を評価するために、合成画像、医療画像、自然画像、ノイズのある自然画像を対象とした実験を行っています。
結果は、私たちが提案した方法の有効性を示しています。

要約(オリジナル)

Image segmentation plays a crucial role in extracting important objects of interest from images, enabling various applications. While existing methods have shown success in segmenting clean images, they often struggle to produce accurate segmentation results when dealing with degraded images, such as those containing noise or occlusions. To address this challenge, interactive segmentation has emerged as a promising approach, allowing users to provide meaningful input to guide the segmentation process. However, an important problem in interactive segmentation lies in determining how to incorporate minimal yet meaningful user guidance into the segmentation model. In this paper, we propose the quasi-conformal interactive segmentation (QIS) model, which incorporates user input in the form of positive and negative clicks. Users mark a few pixels belonging to the object region as positive clicks, indicating that the segmentation model should include a region around these clicks. Conversely, negative clicks are provided on pixels belonging to the background, instructing the model to exclude the region near these clicks from the segmentation mask. Additionally, the segmentation mask is obtained by deforming a template mask with the same topology as the object of interest using an orientation-preserving quasiconformal mapping. This approach helps to avoid topological errors in the segmentation results. We provide a thorough analysis of the proposed model, including theoretical support for the ability of QIS to include or exclude regions of interest or disinterest based on the user’s indication. To evaluate the performance of QIS, we conduct experiments on synthesized images, medical images, natural images and noisy natural images. The results demonstrate the efficacy of our proposed method.

arxiv情報

著者 Han Zhang,Daoping Zhang,Lok Ming Lui
発行日 2024-02-22 16:49:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク