Learnable Polyphase Sampling for Shift Invariant and Equivariant Convolutional Networks

要約

学習可能なポリフェーズ サンプリング (LPS) を提案します。これは、真にシフト不変で同変の畳み込みネットワークを可能にする学習可能なダウン/アップサンプリング レイヤーのペアです。
LPS はデータからエンドツーエンドでトレーニングでき、既存の手作りのダウンサンプリング レイヤーを一般化します。
ダウン/アップサンプリング層を置き換えることにより、任意の畳み込みネットワークに統合できるため、広く適用できます。
画像分類とセマンティック セグメンテーションで LPS を評価します。
実験によると、LPS は、パフォーマンスとシフトの一貫性の両方で、既存の方法と同等またはそれを上回っています。
初めて、セマンティック セグメンテーション (PASCAL VOC) で真のシフト等価性、つまり 100% シフトの一貫性を達成し、ベースラインを絶対 3.3% 上回っています。

要約(オリジナル)

We propose learnable polyphase sampling (LPS), a pair of learnable down/upsampling layers that enable truly shift-invariant and equivariant convolutional networks. LPS can be trained end-to-end from data and generalizes existing handcrafted downsampling layers. It is widely applicable as it can be integrated into any convolutional network by replacing down/upsampling layers. We evaluate LPS on image classification and semantic segmentation. Experiments show that LPS is on-par with or outperforms existing methods in both performance and shift consistency. For the first time, we achieve true shift-equivariance on semantic segmentation (PASCAL VOC), i.e., 100% shift consistency, outperforming baselines by an absolute 3.3%.

arxiv情報

著者 Renan A. Rojas-Gomez,Teck-Yian Lim,Alexander G. Schwing,Minh N. Do,Raymond A. Yeh
発行日 2022-10-14 17:59:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク