SRE-Conv: Symmetric Rotation Equivariant Convolution for Biomedical Image Classification

要約

畳み込みニューラル ネットワーク (CNN) は、コンピューター ビジョン タスクに不可欠なツールですが、回転等分散など、モデルのパフォーマンスをさらに向上させる可能性がある、抽出された特徴に従来求められてきた特性が欠けています。
このような特性は、明示的な方向性が欠けていることが多い生物医学画像に遍在しています。
現在の作業は主に方向情報を取得するためのデータ拡張または明示的なモジュールに依存していますが、これにはトレーニング コストの増加や、望ましい等分散性の非効率的な近似が犠牲になります。
これらの課題を克服するために、モデル サイズを同時に圧縮しながら回転不変特徴を学習するように設計された対称回転等変 (SRE) 畳み込み (SRE-Conv) カーネルの斬新で効率的な実装を提案します。
SRE-Conv カーネルは、任意の CNN バックボーンに簡単に組み込むことができます。
公開されている MedMNISTv2 データセット (合計 16 のタスク) を使用して、ディープ SRE-CNN が回転に対する等分散をキャプチャする機能を検証します。
SRE-Conv-CNN は、2D 画像と 3D 画像の両方で 16 個のテスト データセットすべてで回転画像分類パフォーマンスの精度が向上し、同時にパラメーターが減りメモリ フットプリントが削減されたことで効率が向上することを実証しました。
コードは https://github.com/XYPB/SRE-Conv で入手できます。

要約(オリジナル)

Convolutional neural networks (CNNs) are essential tools for computer vision tasks, but they lack traditionally desired properties of extracted features that could further improve model performance, e.g., rotational equivariance. Such properties are ubiquitous in biomedical images, which often lack explicit orientation. While current work largely relies on data augmentation or explicit modules to capture orientation information, this comes at the expense of increased training costs or ineffective approximations of the desired equivariance. To overcome these challenges, we propose a novel and efficient implementation of the Symmetric Rotation-Equivariant (SRE) Convolution (SRE-Conv) kernel, designed to learn rotation-invariant features while simultaneously compressing the model size. The SRE-Conv kernel can easily be incorporated into any CNN backbone. We validate the ability of a deep SRE-CNN to capture equivariance to rotation using the public MedMNISTv2 dataset (16 total tasks). SRE-Conv-CNN demonstrated improved rotated image classification performance accuracy on all 16 test datasets in both 2D and 3D images, all while increasing efficiency with fewer parameters and reduced memory footprint. The code is available at https://github.com/XYPB/SRE-Conv.

arxiv情報

著者 Yuexi Du,Jiazhen Zhang,Tal Zeevi,Nicha C. Dvornek,John A. Onofrey
発行日 2025-01-16 18:59:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク