Implicit Integration of Superpixel Segmentation into Fully Convolutional Networks

要約

タイトル:完全畳み込みネットワークへのスーパーピクセルセグメンテーションの暗黙的統合
要約:
– スーパーピクセルは画像データの複雑さを減らす有用な表現である。
– しかし、完全畳み込みネットワーク(CNN)にスーパーピクセルをエンドツーエンドで統合するには、スーパーピクセルを生成するための追加のモデルやグラフ畳み込みなどの特別な操作が必要である。
– 本論文では、スーパーピクセルスキームを暗黙的にCNNに統合する方法を提案している。これにより、スーパーピクセルをエンドツーエンドで簡単に使用することができる。
– 提案された方法では、ダウンサンプリング層でピクセルを階層的にグループ化し、スーパーピクセルを生成する。
– 提案された方法は、スーパーピクセルをフィードフォワードパスで使用しないため、既存のアーキテクチャに差し込むことができる。彼らはスーパーピクセルをバイリニア補間の代わりに失われた解像度を回復するために使用する。
– 結果として、私たちの方法は、ダウンサンプリング層を含むモデルでもオブジェクトの境界などの詳細な情報をスーパーピクセルの形式で保持する。
– 私たちはセマンティックセグメンテーション、スーパーピクセルセグメンテーション、単眼深度推定などのタスクで私たちの方法を評価し、現代のアーキテクチャを高速化したり、予測精度を向上させたことを確認している。

要約(オリジナル)

Superpixels are a useful representation to reduce the complexity of image data. However, to combine superpixels with convolutional neural networks (CNNs) in an end-to-end fashion, one requires extra models to generate superpixels and special operations such as graph convolution. In this paper, we propose a way to implicitly integrate a superpixel scheme into CNNs, which makes it easy to use superpixels with CNNs in an end-to-end fashion. Our proposed method hierarchically groups pixels at downsampling layers and generates superpixels. Our method can be plugged into many existing architectures without a change in their feed-forward path because our method does not use superpixels in the feed-forward path but use them to recover the lost resolution instead of bilinear upsampling. As a result, our method preserves detailed information such as object boundaries in the form of superpixels even when the model contains downsampling layers. We evaluate our method on several tasks such as semantic segmentation, superpixel segmentation, and monocular depth estimation, and confirm that it speeds up modern architectures and/or improves their prediction accuracy in these tasks.

arxiv情報

著者 Teppei Suzuki
発行日 2023-05-08 07:40:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク