Scale-Equivariant Deep Learning for 3D Data

要約

タイトル:3Dデータのためのスケール同変深層学習

要約:
– 畳み込みニューラルネットワーク(CNN)の位置に関係なくオブジェクトを認識する能力は、畳み込み操作の変換同変性に起因するものである。
– グループ同変CNNは、入力の他の変換に対してこの同変性を転送する。
– 異なるスケールのオブジェクトやオブジェクト部分を適切に扱うことは挑戦的であり、スケールは基礎となるオブジェクトのサイズや画像取得モダリティの解像度など、複数の理由で変化する可能性がある。
– 本論文では、3D CNNにおいてスケール同変性を保証するスケール同変畳み込みネットワーク層を提案する。
– スケール同変性により、可能なスケールごとに学習する負担を軽減し、ニューラルネットワークがより高次の学習目標に集中できるため、より良い結果とより良いデータ効率性を実現できる。
– 2D領域におけるスケール同変ニューラルネットワークの理論的な基盤と科学的な研究について概要を提供し、概念を3D空間に転送して、3Dデータのためのスケール同変畳み込み層を作成する。
– 提案されたスケール同変層を使用して、医療画像セグメンテーションのためのスケール同変U-Netを作成し、スケール非同変なベースライン方法と比較する。
– 実験結果は、提案手法が3D医療画像解析においてスケール同変性を実現する効果的な手法であることを示している。
– ソースコードをhttps://github.com/wimmerth/scale-equivariant-3d-convnetで公開し、さらなる研究や応用に活用できる。

要約(オリジナル)

The ability of convolutional neural networks (CNNs) to recognize objects regardless of their position in the image is due to the translation-equivariance of the convolutional operation. Group-equivariant CNNs transfer this equivariance to other transformations of the input. Dealing appropriately with objects and object parts of different scale is challenging, and scale can vary for multiple reasons such as the underlying object size or the resolution of the imaging modality. In this paper, we propose a scale-equivariant convolutional network layer for three-dimensional data that guarantees scale-equivariance in 3D CNNs. Scale-equivariance lifts the burden of having to learn each possible scale separately, allowing the neural network to focus on higher-level learning goals, which leads to better results and better data-efficiency. We provide an overview of the theoretical foundations and scientific work on scale-equivariant neural networks in the two-dimensional domain. We then transfer the concepts from 2D to the three-dimensional space and create a scale-equivariant convolutional layer for 3D data. Using the proposed scale-equivariant layer, we create a scale-equivariant U-Net for medical image segmentation and compare it with a non-scale-equivariant baseline method. Our experiments demonstrate the effectiveness of the proposed method in achieving scale-equivariance for 3D medical image analysis. We publish our code at https://github.com/wimmerth/scale-equivariant-3d-convnet for further research and application.

arxiv情報

著者 Thomas Wimmer,Vladimir Golkov,Hoai Nam Dang,Moritz Zaiss,Andreas Maier,Daniel Cremers
発行日 2023-04-12 13:56:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG パーマリンク