Nonlinear Schrödinger Network

要約

ディープ ニューラル ネットワーク (DNN) は、大規模なデータセットから複雑な非線形マッピングを学習することで、さまざまな分野で優れたパフォーマンスを達成しました。
ただし、高い計算コストや解釈可能性の制限などの課題に直面します。
これらの問題に対処するために、物理学と AI を統合するハイブリッド アプローチが注目を集めています。
この論文では、「非線形シュオーディンガー ネットワーク」と呼ばれる新しい物理ベースの AI モデルを紹介します。これは、非線形マッピングやメモリ効果を含む複雑なパターンを学習するための汎用の訓練可能なモデルとして非線形シュオーディンガー方程式 (NLSE) を扱います。
データから。
既存の物理学に基づいた機械学習手法は、ニューラル ネットワークを使用して偏微分方程式 (PDE) の解を近似します。
対照的に、私たちのアプローチでは、ニューラル ネットワークが必要となる一般的な非線形マッピングを取得するためのトレーニング可能なモデルとして PDE を直接扱います。
物理学にヒントを得たアプローチとして、従来のブラックボックス ニューラル ネットワークに代わる、より解釈しやすくパラメーター効率の高い代替手段を提供し、必要なパラメーターの数を大幅に削減しながら、時系列分類タスクで同等以上の精度を達成します。
特に、トレーニングされた非線形シュレディンガー ネットワークは解釈可能であり、すべてのパラメーターは、データをより分離可能な空間に変換する仮想物理システムのプロパティとして物理的な意味を持ちます。
この解釈可能性により、データ変換プロセスの根底にあるダイナミクスを洞察することができます。
時系列予測への応用も検討されています。
現在の実装では NLSE を利用していますが、データから非線形マッピングを学習するためのトレーニング可能なモデルとして物理方程式を使用する提案された方法は NLSE に限定されず、他のマスター物理方程式にも拡張できる可能性があります。

要約(オリジナル)

Deep neural networks (DNNs) have achieved exceptional performance across various fields by learning complex nonlinear mappings from large-scale datasets. However, they encounter challenges such as high computational costs and limited interpretability. To address these issues, hybrid approaches that integrate physics with AI are gaining interest. This paper introduces a novel physics-based AI model called the ‘Nonlinear Schr\’odinger Network’, which treats the Nonlinear Schr\’odinger Equation (NLSE) as a general-purpose trainable model for learning complex patterns including nonlinear mappings and memory effects from data. Existing physics-informed machine learning methods use neural networks to approximate the solutions of partial differential equations (PDEs). In contrast, our approach directly treats the PDE as a trainable model to obtain general nonlinear mappings that would otherwise require neural networks. As a physics-inspired approach, it offers a more interpretable and parameter-efficient alternative to traditional black-box neural networks, achieving comparable or better accuracy in time series classification tasks while significantly reducing the number of required parameters. Notably, the trained Nonlinear Schr\’odinger Network is interpretable, with all parameters having physical meanings as properties of a virtual physical system that transforms the data to a more separable space. This interpretability allows for insight into the underlying dynamics of the data transformation process. Applications to time series forecasting have also been explored. While our current implementation utilizes the NLSE, the proposed method of using physics equations as trainable models to learn nonlinear mappings from data is not limited to the NLSE and may be extended to other master equations of physics.

arxiv情報

著者 Yiming Zhou,Callen MacPhee,Tingyi Zhou,Bahram Jalali
発行日 2024-07-19 17:58:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク