SBDet: A Symmetry-Breaking Object Detector via Relaxed Rotation-Equivariance

要約

Group Equivariant Convolution (GConv) の導入により、モデルは視覚データに隠された対称性を探索できるようになり、パフォーマンスが向上します。
ただし、現実世界のシナリオでは、オブジェクトやシーンが対称システムの摂動、具体的には対称アーキテクチャからの逸脱を示すことが多く、これは対称破壊として知られる対称群の自明ではないアクションによって特徴付けられます。
従来の GConv メソッドは、グループ空間の厳密な操作ルールによって制限され、限られたグループ変換の下で特徴が厳密に等変であることのみを保証するため、対称破壊または非剛体変換に適応することが困難になります。
これを動機として、定義したリラックス回転等変群 $\mathbf{R}_4$ を使用した新しいリラックス回転 GConv (R2GConv) を導入します。
さらに、バックボーンとして緩和回転等変ネットワーク (R2Net) を提案し、その上に構築された 2D 物体検出用の対称破壊物体検出器 (SBDet) をさらに開発します。
実験では、自然画像分類タスクにおける私たちの提案した R2GConv の有効性が実証されており、SBDet は改善された一般化機能と堅牢性により、物体検出タスクにおいて優れたパフォーマンスを達成します。

要約(オリジナル)

Introducing Group Equivariant Convolution (GConv) empowers models to explore symmetries hidden in visual data, improving their performance. However, in real-world scenarios, objects or scenes often exhibit perturbations of a symmetric system, specifically a deviation from a symmetric architecture, which can be characterized by a non-trivial action of a symmetry group, known as Symmetry-Breaking. Traditional GConv methods are limited by the strict operation rules in the group space, only ensuring features remain strictly equivariant under limited group transformations, making it difficult to adapt to Symmetry-Breaking or non-rigid transformations. Motivated by this, we introduce a novel Relaxed Rotation GConv (R2GConv) with our defined Relaxed Rotation-Equivariant group $\mathbf{R}_4$. Furthermore, we propose a Relaxed Rotation-Equivariant Network (R2Net) as the backbone and further develop the Symmetry-Breaking Object Detector (SBDet) for 2D object detection built upon it. Experiments demonstrate the effectiveness of our proposed R2GConv in natural image classification tasks, and SBDet achieves excellent performance in object detection tasks with improved generalization capabilities and robustness.

arxiv情報

著者 Zhiqiang Wu,Yingjie Liu,Hanlin Dong,Xuan Tang,Jian Yang,Bo Jin,Mingsong Chen,Xian Wei
発行日 2024-08-21 16:32:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク