On the Fourier analysis in the SO(3) space : EquiLoPO Network

要約

回転不変性または同等性による体積データの分析は、現在の研究では積極的なトピックです。
既存のディープラーニングアプローチでは、個別の回転に限定されたグループの畳み込みネットワークまたは制限されたフィルター構造を備えた操縦可能な畳み込みネットワークに限定されています。
この作業では、制約のないトレーニング可能なフィルター – Equilopoネットワークを許可しながら、連続SO(3)グループのローカルパターン方向への分析的等語を達成する新しい等量性ニューラルネットワークアーキテクチャを提案します。
私たちの主要な革新は、フーリエ基底としての還元可能な表現を活用するグループの畳み込み操作と、入力関数から出力関数への明確に定義されたマッピングを提供するSO(3)空間の局所的な活性化関数です。
これらの操作をResNetスタイルのアーキテクチャに統合することにより、以前の方法の制限を克服するモデルを提案します。
MedMnist3Dからの多様な3D医療イメージングデータセットに関する包括的な評価は、私たちのアプローチの有効性を示しており、これは一貫して最先端を上回ります。
この作業は、SO(3)と局所的なアクティベーション関数によって有効になった柔軟な制約のないフィルターに対する真の回転等量の利点を示唆しており、ドメイン全体の潜在的なアプリケーションを備えたボリューム測定データの等量学習のための柔軟なフレームワークを提供します。
私たちのコードは、https://gricad-gitlab.univ-grenoble-alpes.fr/grulab/ilpo/-/tree/main/equilopoで公開されています。

要約(オリジナル)

Analyzing volumetric data with rotational invariance or equivariance is an active topic in current research. Existing deep-learning approaches utilize either group convolutional networks limited to discrete rotations or steerable convolutional networks with constrained filter structures. This work proposes a novel equivariant neural network architecture that achieves analytical Equivariance to Local Pattern Orientation on the continuous SO(3) group while allowing unconstrained trainable filters – EquiLoPO Network. Our key innovations are a group convolutional operation leveraging irreducible representations as the Fourier basis and a local activation function in the SO(3) space that provides a well-defined mapping from input to output functions, preserving equivariance. By integrating these operations into a ResNet-style architecture, we propose a model that overcomes the limitations of prior methods. A comprehensive evaluation on diverse 3D medical imaging datasets from MedMNIST3D demonstrates the effectiveness of our approach, which consistently outperforms state of the art. This work suggests the benefits of true rotational equivariance on SO(3) and flexible unconstrained filters enabled by the local activation function, providing a flexible framework for equivariant deep learning on volumetric data with potential applications across domains. Our code is publicly available at https://gricad-gitlab.univ-grenoble-alpes.fr/GruLab/ILPO/-/tree/main/EquiLoPO.

arxiv情報

著者 Dmitrii Zhemchuzhnikov,Sergei Grudinin
発行日 2025-03-19 14:43:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, math.GR パーマリンク