Moving Frame Net: SE(3)-Equivariant Network for Volumes

要約

ニューラルネットワークの変換に対する等変量性は、コンピュータビジョンの課題において、対称性(スケーリング、回転、並進など)を持つデータセットに適用することで、その性能を向上させ、汎化誤差を低減するのに役立つとされています。最近、画像データに対する回転・並進等価ニューラルネットワークが、ムービングフレームアプローチに基づいて提案されました。本論文では、各層で繰り返し計算していた移動フレームの計算を入力段で1回に減らすことで、そのアプローチを大幅に改善した。そして、その結果得られたアーキテクチャの等変量性を理論的に証明し、3次元空間上の信号であるボリュームを処理するための回転・並進等変量ニューラルネットワークを構築する。我々の学習したモデルは、MedMNIST3Dのテストデータセットのほとんどで、医療用ボリューム分類においてベンチマークを上回る性能を示した。

要約(オリジナル)

Equivariance of neural networks to transformations helps to improve their performance and reduce generalization error in computer vision tasks, as they apply to datasets presenting symmetries (e.g. scalings, rotations, translations). The method of moving frames is classical for deriving operators invariant to the action of a Lie group in a manifold.Recently, a rotation and translation equivariant neural network for image data was proposed based on the moving frames approach. In this paper we significantly improve that approach by reducing the computation of moving frames to only one, at the input stage, instead of repeated computations at each layer. The equivariance of the resulting architecture is proved theoretically and we build a rotation and translation equivariant neural network to process volumes, i.e. signals on the 3D space. Our trained model overperforms the benchmarks in the medical volume classification of most of the tested datasets from MedMNIST3D.

arxiv情報

著者 Mateus Sangalli,Samy Blusseau,Santiago Velasco-Forero,Jesus Angulo
発行日 2022-11-07 10:25:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, stat.ML パーマリンク