要約
最近、CNNを介したスーパーピクセルセグメンテーションのための教師なし学習の概念が研究されています。
基本的に、このような方法は、単一の画像で使用される畳み込みニューラルネットワーク(CNN)によってスーパーピクセルを生成し、このようなCNNは、ラベルや詳細情報なしでトレーニングされます。
したがって、このようなアプローチは、通常、意味のあるスーパーピクセルセグメンテーションに向けてソリューションを導く目的関数を設計することにより、事前分布の組み込みに依存します。
この論文では、そのようなネットワークの有効性を改善するための3つの重要な要素を提案します。(i)入力画像と比較した\ emph {soft}スーパーピクセル化画像の類似性、(ii)オブジェクトのエッジと境界の強化と考慮、および(
iii)強力な畳み込みに基づく変更されたアーキテクチャ。これにより、より広い視野が可能になり、ネットワーク内のマルチスケールコンポーネントとして機能します。
BSDS500データセットを実験することにより、定性的および定量的の両方で、提案の重要性の証拠を見つけます。
要約(オリジナル)
Recently, the concept of unsupervised learning for superpixel segmentation via CNNs has been studied. Essentially, such methods generate superpixels by convolutional neural network (CNN) employed on a single image, and such CNNs are trained without any labels or further information. Thus, such approach relies on the incorporation of priors, typically by designing an objective function that guides the solution towards a meaningful superpixel segmentation. In this paper we propose three key elements to improve the efficacy of such networks: (i) the similarity of the \emph{soft} superpixelated image compared to the input image, (ii) the enhancement and consideration of object edges and boundaries and (iii) a modified architecture based on atrous convolution, which allow for a wider field of view, functioning as a multi-scale component in our network. By experimenting with the BSDS500 dataset, we find evidence to the significance of our proposal, both qualitatively and quantitatively.
arxiv情報
著者 | Moshe Eliasof,Nir Ben Zikri,Eran Treister |
発行日 | 2022-06-21 09:30:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google