A novel Fourier neural operator framework for classification of multi-sized images: Application to three dimensional digital porous media

要約

フーリエ ニューラル オペレーター (FNO) は入力画像のサイズに関して不変であるため、従来の畳み込みニューラル ネットワーク (CNN) とは対照的に、ネットワーク アーキテクチャを変更することなく、あらゆるサイズの画像を FNO ベースのフレームワークに入力できます。
FNO の利点を活用して、さまざまなサイズの画像を分類するための新しい深層学習フレームワークを提案します。
特に、提案されたネットワークをマルチサイズの画像上で同時にトレーニングします。
実際の応用として、三次元デジタル多孔質媒体のラベル (透過性など) を予測する問題を検討します。
フレームワークを構築するための直感的なアプローチは、適応最大プーリングを使用して FNO レイヤーを分類器に接続することです。
まず、このアプローチは固定サイズの多孔質媒体に対してのみ有効であり、さまざまなサイズの多孔質媒体に対しては効果がないことを示します。
この制限を克服するために、私たちはアプローチを導入します。適応型最大プーリングを使用する代わりに、FNO 層のチャネル幅のサイズを使用した静的最大プーリングを使用します。
FNO レイヤーのチャネル幅は入力画像のサイズに依存しないため、導入されたフレームワークはトレーニング中にマルチサイズの画像を処理できます。
さまざまなサイズの三次元デジタル多孔質媒体の分類の例を通じて、導入されたフレームワークの有効性を示し、そのパフォーマンスを直感的なアプローチと比較します。

要約(オリジナル)

Fourier neural operators (FNOs) are invariant with respect to the size of input images, and thus images with any size can be fed into FNO-based frameworks without any modification of network architectures, in contrast to traditional convolutional neural networks (CNNs). Leveraging the advantage of FNOs, we propose a novel deep-learning framework for classifying images with varying sizes. Particularly, we simultaneously train the proposed network on multi-sized images. As a practical application, we consider the problem of predicting the label (e.g., permeability) of three-dimensional digital porous media. To construct the framework, an intuitive approach is to connect FNO layers to a classifier using adaptive max pooling. First, we show that this approach is only effective for porous media with fixed sizes, whereas it fails for porous media of varying sizes. To overcome this limitation, we introduce our approach: instead of using adaptive max pooling, we use static max pooling with the size of channel width of FNO layers. Since the channel width of the FNO layers is independent of input image size, the introduced framework can handle multi-sized images during training. We show the effectiveness of the introduced framework and compare its performance with the intuitive approach through the example of the classification of three-dimensional digital porous media of varying sizes.

arxiv情報

著者 Ali Kashefi,Tapan Mukerji
発行日 2024-04-12 15:17:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク