Training normalizing flows with computationally intensive target probability distributions

要約

機械学習技術、特にいわゆる正規化フローは、ターゲットの確率分布を効果的に近似できるため、モンテカルロ シミュレーションのコンテキストでますます人気が高まっています。
格子場理論 (LFT) の場合、ターゲット分布は作用の指数関数によって与えられます。
「再パラメータ化トリック」に基づく一般的な損失関数の勾配推定器では、フィールドに関するアクションの導関数の計算が必要です。
これにより、複雑で非ローカルなアクションの場合、多大な計算コストが発生する可能性があります。
QCD におけるフェルミオン作用。
この寄稿では、この問題を回避する REINFORCE アルゴリズムに基づいてフローを正規化するための推定器を提案します。
これを臨界時のウィルソン フェルミオンを使用した 2 次元シュウィンガー モデルに適用し、再パラメータ化トリック推定器よりも実測時間の点で最大 10 倍高速であることと、必要なメモリが最大 $30\%$ 少ないことを示します。
また、数値的にも安定しており、単精度計算や半浮動小数点テンソル コアの使用が可能です。
これらの改善の起源についての詳細な分析を紹介します。
私たちは、これらの利点は、LFT の領域外でも、ターゲットの確率分布が計算量を多く必要とする場合に現れると考えています。

要約(オリジナル)

Machine learning techniques, in particular the so-called normalizing flows, are becoming increasingly popular in the context of Monte Carlo simulations as they can effectively approximate target probability distributions. In the case of lattice field theories (LFT) the target distribution is given by the exponential of the action. The common loss function’s gradient estimator based on the ‘reparametrization trick’ requires the calculation of the derivative of the action with respect to the fields. This can present a significant computational cost for complicated, non-local actions like e.g. fermionic action in QCD. In this contribution, we propose an estimator for normalizing flows based on the REINFORCE algorithm that avoids this issue. We apply it to two dimensional Schwinger model with Wilson fermions at criticality and show that it is up to ten times faster in terms of the wall-clock time as well as requiring up to $30\%$ less memory than the reparameterization trick estimator. It is also more numerically stable allowing for single precision calculations and the use of half-float tensor cores. We present an in-depth analysis of the origins of those improvements. We believe that these benefits will appear also outside the realm of the LFT, in each case where the target probability distribution is computationally intensive.

arxiv情報

著者 Piotr Bialas,Piotr Korcyl,Tomasz Stebel
発行日 2024-02-28 15:48:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cc:68T07, cond-mat.stat-mech, cs.LG, hep-lat, I.2.6 パーマリンク