Advection Augmented Convolutional Neural Networks

要約

物理科学における多くの問題は、時空シーケンスの予測によって特徴付けられます。
このような問題は、天気予報から病気の伝播の分析、ビデオ予測まで多岐にわたります。
これらの問題を解決するための最新の技術は、通常、畳み込みニューラル ネットワーク (CNN) アーキテクチャと時間予測メカニズムを組み合わせています。
しかし、多くの場合、そのようなアプローチは長距離の情報伝達ではパフォーマンスが低下し、説明可能性に欠けます。
この研究では、そのような問題を解決するために、物理的にインスピレーションを得たアーキテクチャを導入します。
つまり、新しいセミラグランジュ プッシュ演算子を設計することにより、移流を使用して CNN を強化することを提案します。
提案された演算子は、標準の畳み込みカーネルと比較して、情報の非局所的な変換を可能にすることを示します。
次に、それを反応および拡散ニューラル コンポーネントで補完して、高次元で反応-移流-拡散方程式を模倣するネットワークを形成します。
私たちは、そのメリットを示す多数の時空間データセット上でネットワークの有効性を実証します。

要約(オリジナル)

Many problems in physical sciences are characterized by the prediction of space-time sequences. Such problems range from weather prediction to the analysis of disease propagation and video prediction. Modern techniques for the solution of these problems typically combine Convolution Neural Networks (CNN) architecture with a time prediction mechanism. However, oftentimes, such approaches underperform in the long-range propagation of information and lack explainability. In this work, we introduce a physically inspired architecture for the solution of such problems. Namely, we propose to augment CNNs with advection by designing a novel semi-Lagrangian push operator. We show that the proposed operator allows for the non-local transformation of information compared with standard convolutional kernels. We then complement it with Reaction and Diffusion neural components to form a network that mimics the Reaction-Advection-Diffusion equation, in high dimensions. We demonstrate the effectiveness of our network on a number of spatio-temporal datasets that show their merit.

arxiv情報

著者 Niloufar Zakariaei,Siddharth Rout,Eldad Haber,Moshe Eliasof
発行日 2024-06-27 15:22:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク