ILPO-NET: Network for the invariant recognition of arbitrary volumetric patterns in 3D

要約

空間パターンを効果的に認識し、その階層構造を学習することは、現代の空間データ解析において極めて重要である。ボリューメトリックデータのアプリケーションでは、シフトだけでなくパターンの回転に対しても不変であることを保証する技術が求められている。従来の手法では並進不変性は容易に達成できるが、回転不変性には多くの課題があり、依然として活発な研究分野である。ここでは、ウィグナー行列展開を用いて、局所的な空間パターンの方向に対して本質的に不変な畳み込み演算により、任意形状のパターンを扱う新しいアプローチであるILPO-Net(Invariant to Local Patterns Orientation Network)を紹介する。我々のアーキテクチャは、新しい畳み込み演算子をシームレスに統合し、MedMNISTやCATHのような多様なボリュームメトリックデータセットでベンチマークを行ったところ、MedMNISTの場合は最大1000分の1という大幅に少ないパラメータ数で、ベースラインよりも優れた性能を実証した。これらの実証にとどまらず、ILPO-Netの回転不変性は、様々な分野にわたる他のアプリケーションへの道を開くものである。我々のコードは https://gricad-gitlab.univ-grenoble-alpes.fr/GruLab/ILPONet で公開されている。

要約(オリジナル)

Effective recognition of spatial patterns and learning their hierarchy is crucial in modern spatial data analysis. Volumetric data applications seek techniques ensuring invariance not only to shifts but also to pattern rotations. While traditional methods can readily achieve translational invariance, rotational invariance possesses multiple challenges and remains an active area of research. Here, we present ILPO-Net (Invariant to Local Patterns Orientation Network), a novel approach that handles arbitrarily shaped patterns with the convolutional operation inherently invariant to local spatial pattern orientations using the Wigner matrix expansions. Our architecture seamlessly integrates the new convolution operator and, when benchmarked on diverse volumetric datasets such as MedMNIST and CATH, demonstrates superior performance over the baselines with significantly reduced parameter counts – up to 1000 times fewer in the case of MedMNIST. Beyond these demonstrations, ILPO-Net’s rotational invariance paves the way for other applications across multiple disciplines. Our code is publicly available at https://gricad-gitlab.univ-grenoble-alpes.fr/GruLab/ILPONet.

arxiv情報

著者 Dmitrii Zhemchuzhnikov,Sergei Grudinin
発行日 2024-04-04 14:44:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク