要約
色や空間位置などの特徴に関するピクセルの類似性に基づいてイメージをスーパーピクセルに分割すると、データの複雑さが大幅に軽減され、後続のイメージ処理タスクが改善されます。
教師なしスーパーピクセル生成の初期アルゴリズムは、任意のエッジよりも重要なエッジを優先することなく、ローカル キューのみに依存していました。
一方、教師なし深層学習に基づく最近の方法では、スーパーピクセル エッジの遵守とコンパクトさの間のトレードオフに適切に対処できないか、生成されたスーパーピクセル数を制御できません。
非畳み込み画像デコーダで入力として強い空間相関を持つランダム画像、つまりぼやけたノイズ画像を使用することにより、予想されるコントラストの数を減らし、再構成された画像で滑らかで接続されたエッジを強制できます。
追加の空間情報をデコーダーの最後の隠れ層から部分的にスムーズなアクティベーション マップにエンコードすることでエッジ スパース ピクセル埋め込みを生成し、標準のクラスタリング アルゴリズムを使用して高品質のスーパーピクセルを抽出します。
提案された方法は、BSDS500、PASCAL-Context、および顕微鏡データセットで最先端のパフォーマンスに達します。
要約(オリジナル)
Partitioning an image into superpixels based on the similarity of pixels with respect to features such as colour or spatial location can significantly reduce data complexity and improve subsequent image processing tasks. Initial algorithms for unsupervised superpixel generation solely relied on local cues without prioritizing significant edges over arbitrary ones. On the other hand, more recent methods based on unsupervised deep learning either fail to properly address the trade-off between superpixel edge adherence and compactness or lack control over the generated number of superpixels. By using random images with strong spatial correlation as input, \ie, blurred noise images, in a non-convolutional image decoder we can reduce the expected number of contrasts and enforce smooth, connected edges in the reconstructed image. We generate edge-sparse pixel embeddings by encoding additional spatial information into the piece-wise smooth activation maps from the decoder’s last hidden layer and use a standard clustering algorithm to extract high quality superpixels. Our proposed method reaches state-of-the-art performance on the BSDS500, PASCAL-Context and a microscopy dataset.
arxiv情報
著者 | Jakob Geusen,Gustav Bredell,Tianfei Zhou,Ender Konukoglu |
発行日 | 2022-11-29 09:08:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google