Deep reinforced learning heuristic tested on spin-glass ground states: The larger picture

要約

Changjun Fanらで。
[Nature Communications https://doi.org/10.1038/s41467-023-36363-w (2023)]、著者らは組み合わせ最適化ヒューリスティックを強化するための深層強化学習アプローチを提示しています。
特に、シミュレーション アニーリング (SA) や並列焼き戻し (PT) などのいくつかのモンテカルロ ベースの方法と比較して、非平面ネットワーク上のインスタンスは一般に NP 困難であるいくつかのスピン グラス基底状態問題の結果を示しています。
.
実際、これらの結果は、強化された学習が SA または PT で得られた結果よりも結果を改善すること、または少なくとも他の方法と比較して同等の品質の結果が得られる前にヒューリスティックの実行時間を短縮できることを示しています。
彼らの方法が「優れている」という結論を容易にするために、著者は 2 つの基本的な戦略を追求しています。
ヒューリスティック間の直接比較は、正確な基底状態を確認するのが難しい、より大きなインスタンスのサンプルに対して提供されます。
ここでは、これらの研究をより大きな文脈に当てはめ、主張されている優位性は、より小さなサンプルではせいぜい限界であり、より大きなサンプルの真の基底状態の賢明な近似に関しては本質的に無関係になることを示しています.
たとえば、この方法は、著者が述べたように、$d>2$ で剛性指数 $\theta$ を決定する手段としては無関係になります。ここで、問題は NP 困難であるだけでなく、2 つのほぼ等しい地面の減算が必要です。
ここで見つかった $\approx 1\%$ のそれぞれの状態エネルギーと系統誤差は受け入れられません。
メソッドに関するこの全体像は、数十年にわたって利用可能であったデータを使用して、著者が採用しているスピン グラス アンサンブルに対する単純な有限サイズ補正研究から生じています。

要約(オリジナル)

In Changjun Fan et al. [Nature Communications https://doi.org/10.1038/s41467-023-36363-w (2023)], the authors present a deep reinforced learning approach to augment combinatorial optimization heuristics. In particular, they present results for several spin glass ground state problems, for which instances on non-planar networks are generally NP-hard, in comparison with several Monte Carlo based methods, such as simulated annealing (SA) or parallel tempering (PT). Indeed, those results demonstrate that the reinforced learning improves the results over those obtained with SA or PT, or at least allows for reduced runtimes for the heuristics before results of comparable quality have been obtained relative to those other methods. To facilitate the conclusion that their method is ”superior”, the authors pursue two basic strategies: (1) A commercial GUROBI solver is called on to procure a sample of exact ground states as a testbed to compare with, and (2) a head-to-head comparison between the heuristics is given for a sample of larger instances where exact ground states are hard to ascertain. Here, we put these studies into a larger context, showing that the claimed superiority is at best marginal for smaller samples and becomes essentially irrelevant with respect to any sensible approximation of true ground states in the larger samples. For example, this method becomes irrelevant as a means to determine stiffness exponents $\theta$ in $d>2$, as mentioned by the authors, where the problem is not only NP-hard but requires the subtraction of two almost equal ground-state energies and systemic errors in each of $\approx 1\%$ found here are unacceptable. This larger picture on the method arises from a straightforward finite-size corrections study over the spin glass ensembles the authors employ, using data that has been available for decades.

arxiv情報

著者 Stefan Boettcher
発行日 2023-02-21 17:59:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.dis-nn, cond-mat.stat-mech, cs.AI, cs.LG パーマリンク