要約
CNN は翻訳に対して不変であると考えられていますが、最近の研究では、ダウンサンプリング レイヤーに起因するエイリアシング効果により、そうではないことが示されています。
エイリアシングを防止するための既存のアーキテクチャ ソリューションは、非線形性に起因するこれらの影響を解決しないため、部分的なものです。
ダウンサンプリング層と非線形層の両方に取り組む拡張アンチエイリアシング手法を提案し、真にエイリアスのないシフト不変の CNN を作成します。
提示されたモデルは、整数および分数 (つまり、サブピクセル) 変換に対して不変であり、敵対的変換に対する堅牢性の点で他のシフト不変方法よりも優れていることを示します。
要約(オリジナル)
Although CNNs are believed to be invariant to translations, recent works have shown this is not the case, due to aliasing effects that stem from downsampling layers. The existing architectural solutions to prevent aliasing are partial since they do not solve these effects, that originate in non-linearities. We propose an extended anti-aliasing method that tackles both downsampling and non-linear layers, thus creating truly alias-free, shift-invariant CNNs. We show that the presented model is invariant to integer as well as fractional (i.e., sub-pixel) translations, thus outperforming other shift-invariant methods in terms of robustness to adversarial translations.
arxiv情報
著者 | Hagay Michaeli,Tomer Michaeli,Daniel Soudry |
発行日 | 2023-03-15 08:40:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google