Efficient Learning of Accurate Surrogates for Simulations of Complex Systems


この方法には、現在のアプローチに比べて 2 つの利点があります。
まず、モデルの応答曲面上のすべての転換点がトレーニング データに含まれていることを確認します。
第 2 に、新しいモデルの評価後、サロゲートがテストされ、「スコア」が有効性のしきい値を下回った場合は「再トレーニング」(更新) されます。
ベンチマーク関数のテストでは、スコアリング メトリックが全体的な精度を優先する場合でも、オプティマイザー主導のサンプリングが局所的な極値付近の精度の点で一般的に従来のサンプリング方法よりも優れていることが明らかになりました。


Machine learning methods are increasingly used to build computationally inexpensive surrogates for complex physical models. The predictive capability of these surrogates suffers when data are noisy, sparse, or time-dependent. As we are interested in finding a surrogate that provides valid predictions of any potential future model evaluations, we introduce an online learning method empowered by optimizer-driven sampling. The method has two advantages over current approaches. First, it ensures that all turning points on the model response surface are included in the training data. Second, after any new model evaluations, surrogates are tested and ‘retrained’ (updated) if the ‘score’ drops below a validity threshold. Tests on benchmark functions reveal that optimizer-directed sampling generally outperforms traditional sampling methods in terms of accuracy around local extrema, even when the scoring metric favors overall accuracy. We apply our method to simulations of nuclear matter to demonstrate that highly accurate surrogates for the nuclear equation of state can be reliably auto-generated from expensive calculations using a few model evaluations.


著者 A. Diaw,M. McKerns,I. Sagert,L. G. Stanton,M. S. Murillo
発行日 2024-05-17 16:26:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, nucl-th, physics.comp-ph, physics.data-an, physics.plasm-ph パーマリンク