Efficient Learning of Accurate Surrogates for Simulations of Complex Systems

要約

機械学習手法は、複雑な物理モデルの計算コストの低いサロゲートを構築するためにますます使用されています。
データにノイズが多い、まばらである、または時間に依存している場合、これらのサロゲートの予測能力は低下します。
私たちは、潜在的な将来のモデル評価の有効な予測を提供するサロゲートを見つけることに興味があるため、オプティマイザー主導のサンプリングを利用したオンライン学習方法を導入します。
この方法には、現在のアプローチに比べて 2 つの利点があります。
まず、モデルの応答曲面上のすべての転換点がトレーニング データに含まれていることを確認します。
第 2 に、新しいモデルの評価後、サロゲートがテストされ、「スコア」が有効性のしきい値を下回った場合は「再トレーニング」(更新) されます。
ベンチマーク関数のテストでは、スコアリング メトリックが全体的な精度を優先する場合でも、オプティマイザー主導のサンプリングが局所的な極値付近の精度の点で一般的に従来のサンプリング方法よりも優れていることが明らかになりました。
私たちの方法を核物質のシミュレーションに適用し、核の状態方程式の高精度の代用値が、いくつかのモデル評価を使用した高価な計算から確実に自動生成できることを実証します。

要約(オリジナル)

Machine learning methods are increasingly used to build computationally inexpensive surrogates for complex physical models. The predictive capability of these surrogates suffers when data are noisy, sparse, or time-dependent. As we are interested in finding a surrogate that provides valid predictions of any potential future model evaluations, we introduce an online learning method empowered by optimizer-driven sampling. The method has two advantages over current approaches. First, it ensures that all turning points on the model response surface are included in the training data. Second, after any new model evaluations, surrogates are tested and ‘retrained’ (updated) if the ‘score’ drops below a validity threshold. Tests on benchmark functions reveal that optimizer-directed sampling generally outperforms traditional sampling methods in terms of accuracy around local extrema, even when the scoring metric favors overall accuracy. We apply our method to simulations of nuclear matter to demonstrate that highly accurate surrogates for the nuclear equation of state can be reliably auto-generated from expensive calculations using a few model evaluations.

arxiv情報

著者 A. Diaw,M. McKerns,I. Sagert,L. G. Stanton,M. S. Murillo
発行日 2024-05-17 16:26:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, nucl-th, physics.comp-ph, physics.data-an, physics.plasm-ph パーマリンク