Probabilistic transfer learning methodology to expedite high fidelity simulation of reactive flows

要約

主成分 (PC) 輸送や機械学習 (ML) 技術など、熱化学状態の低次元多様体表現の輸送に基づく次数低減モデルは、直接数値シミュレーション (DNS) に関連する計算コストを削減するために開発されています。
) の反応性フロー。
PC トランスポートと ML は通常、十分な予測精度を示すために大量のデータを必要としますが、DNS や実験データ取得に法外なコストがかかるため、データを利用できない場合があります。
このような問題を軽減するために、既存のデータセットまたはドメイン (ソース ドメイン) からの同様のデータを使用して ML モデルをトレーニングすることができ、対象のドメイン (ターゲット ドメイン) で適切な予測が得られる可能性があります。
この研究では、低次元多様体と疎なデータ設定における熱化学状態を正確に予測する際の ML モデルの信頼性を高めるための、新しい確率的転移学習 (TL) フレームワークを紹介します。
このフレームワークは、ベイジアン ニューラル ネットワークとオートエンコーダーを使用して、状態空間の次元を削減し、ソースからターゲット ドメインに知識を拡散します。
新しいフレームワークは、さまざまなデータ疎性シナリオの下で、一次元の自由伝播火炎ソリューションに適用されます。
結果は、転送すべき最適な知識量が存在することを明らかにしました。これは、ターゲット ドメインで利用可能なデータの量とドメイン間の類似性に依存します。
TL は、スパース性が大きい場合の再構成誤差を 1 桁減らすことができます。
新しいフレームワークでは、ターゲット ドメインで同じエラーを再現するために必要なデータが、豊富なデータのシナリオと比べて 10 分の 1 に減少しました。
さらに、最先端の決定論的 TL 戦略との比較では、確率論的手法では、同じ再構成誤差を達成するために必要なデータが 4 分の 1 に抑えられることが示されています。

要約(オリジナル)

Reduced order models based on the transport of a lower dimensional manifold representation of the thermochemical state, such as Principal Component (PC) transport and Machine Learning (ML) techniques, have been developed to reduce the computational cost associated with the Direct Numerical Simulations (DNS) of reactive flows. Both PC transport and ML normally require an abundance of data to exhibit sufficient predictive accuracy, which might not be available due to the prohibitive cost of DNS or experimental data acquisition. To alleviate such difficulties, similar data from an existing dataset or domain (source domain) can be used to train ML models, potentially resulting in adequate predictions in the domain of interest (target domain). This study presents a novel probabilistic transfer learning (TL) framework to enhance the trust in ML models in correctly predicting the thermochemical state in a lower dimensional manifold and a sparse data setting. The framework uses Bayesian neural networks, and autoencoders, to reduce the dimensionality of the state space and diffuse the knowledge from the source to the target domain. The new framework is applied to one-dimensional freely-propagating flame solutions under different data sparsity scenarios. The results reveal that there is an optimal amount of knowledge to be transferred, which depends on the amount of data available in the target domain and the similarity between the domains. TL can reduce the reconstruction error by one order of magnitude for cases with large sparsity. The new framework required 10 times less data for the target domain to reproduce the same error as in the abundant data scenario. Furthermore, comparisons with a state-of-the-art deterministic TL strategy show that the probabilistic method can require four times less data to achieve the same reconstruction error.

arxiv情報

著者 Bruno S. Soriano,Ki Sung Jung,Tarek Echekki,Jacqueline H. Chen,Mohammad Khalil
発行日 2024-05-17 17:58:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph パーマリンク