要約
Group Equivariant Convolution(GCONV)は、モデルがデータの根本的な対称性を探求し、パフォーマンスを改善できるようにします。
ただし、現実世界のシナリオは、対称グループの非重要な作用を特徴とする物理的順列によって引き起こされる理想的な対称システムから逸脱することが多く、対称性破壊として知られる現象に影響を与える非対称性をもたらします。
従来のGCONVベースの方法は、グループ空間内の剛性のある運用ルールによって制約されています。これは、データが限られたグループ変換後も厳密に対称的なままであると仮定します。
この制限により、対称性の破壊的および非剛性変換に適応することが困難になります。
これに動機付けられて、私たちは主に共通のシナリオである回転対称性に焦点を当てています。
厳密な回転等等層グループ$ \ mathbf {c} _n $内で厳密なグループ変換をリラックスさせることにより、リラックスした回転等等等級グループ$ \ mathbf {r} _n $を再定義し、$ 4n $ $のパラメーターを最小限に抑えて、新しいリラックスしたローテーションエクイバリアントGCONV(R2GCONV)を導入します。
R2GCONVに基づいて、2Dオブジェクト検出のためにリラックスした回転エクイバリアントネットワーク(R2NET)をバックボーンとして提案し、リラックスした回転等式オブジェクト検出器(R2DET)を開発します。
実験結果は、自然画像分類における提案されたR2GCONVの有効性を示し、R2DETは、一般化能力と堅牢性を改善した2Dオブジェクト検出で優れたパフォーマンスを達成します。
このコードは、\ texttt {https://github.com/wuer5/r2det}で使用できます。
要約(オリジナル)
Group Equivariant Convolution (GConv) empowers models to explore underlying symmetry in data, improving performance. However, real-world scenarios often deviate from ideal symmetric systems caused by physical permutation, characterized by non-trivial actions of a symmetry group, resulting in asymmetries that affect the outputs, a phenomenon known as Symmetry Breaking. Traditional GConv-based methods are constrained by rigid operational rules within group space, assuming data remains strictly symmetry after limited group transformations. This limitation makes it difficult to adapt to Symmetry-Breaking and non-rigid transformations. Motivated by this, we mainly focus on a common scenario: Rotational Symmetry-Breaking. By relaxing strict group transformations within Strict Rotation-Equivariant group $\mathbf{C}_n$, we redefine a Relaxed Rotation-Equivariant group $\mathbf{R}_n$ and introduce a novel Relaxed Rotation-Equivariant GConv (R2GConv) with only a minimal increase of $4n$ parameters compared to GConv. Based on R2GConv, we propose a Relaxed Rotation-Equivariant Network (R2Net) as the backbone and develop a Relaxed Rotation-Equivariant Object Detector (R2Det) for 2D object detection. Experimental results demonstrate the effectiveness of the proposed R2GConv in natural image classification, and R2Det achieves excellent performance in 2D object detection with improved generalization capabilities and robustness. The code is available in \texttt{https://github.com/wuer5/r2det}.
arxiv情報
著者 | Zhiqiang Wu,Yingjie Liu,Hanlin Dong,Xuan Tang,Jian Yang,Bo Jin,Mingsong Chen,Xian Wei |
発行日 | 2025-03-04 14:04:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google