要約
畳み込みネットワークはシフトに不変と考えられているが、その応答は物体の正確な位置によって変化することが実証されている。本論文では、一般的に調査されているデータセットのほとんどに、学習時にオブジェクトが画像の中心に過剰に表現されるバイアスがあることを示す。このバイアスとネットワークの境界条件は、これらのアーキテクチャの性能に大きな影響を与え、物体が境界に近づくにつれて精度が著しく低下する。また、この影響をデータ増強技術によってどのように軽減できるかを示す。
要約(オリジナル)
Convolutional networks are considered shift invariant, but it was demonstrated that their response may vary according to the exact location of the objects. In this paper we will demonstrate that most commonly investigated datasets have a bias, where objects are over-represented at the center of the image during training. This bias and the boundary condition of these networks can have a significant effect on the performance of these architectures and their accuracy drops significantly as an object approaches the boundary. We will also demonstrate how this effect can be mitigated with data augmentation techniques.
arxiv情報
著者 | Gergely Szabo,Andras Horvath |
発行日 | 2023-08-04 16:01:02+00:00 |
arxivサイト | arxiv_id(pdf) |