Black holes and the loss landscape in machine learning


多くのニューラル ネットワーク アーキテクチャに共通する損失関数の重要な特徴の 1 つは、指数関数的に多くの低い位置にある極小値が存在することです。
明確にするために、$\mathcal{N} = 8$ 弦理論の 1/8 BPS ブラック ホールを考慮します。
これらは、対応するブラック ホールの微視的記述で生じる潜在的な風景の無限のファミリーを提供します。
最小値のカウントは、ブラック ホールのマイクロステートのカウントに相当します。


Understanding the loss landscape is an important problem in machine learning. One key feature of the loss function, common to many neural network architectures, is the presence of exponentially many low lying local minima. Physical systems with similar energy landscapes may provide useful insights. In this work, we point out that black holes naturally give rise to such landscapes, owing to the existence of black hole entropy. For definiteness, we consider 1/8 BPS black holes in $\mathcal{N} = 8$ string theory. These provide an infinite family of potential landscapes arising in the microscopic descriptions of corresponding black holes. The counting of minima amounts to black hole microstate counting. Moreover, the exact numbers of the minima for these landscapes are a priori known from dualities in string theory. Some of the minima are connected by paths of low loss values, resembling mode connectivity. We estimate the number of runs needed to find all the solutions. Initial explorations suggest that Stochastic Gradient Descent can find a significant fraction of the minima.


著者 Pranav Kumar,Taniya Mandal,Swapnamay Mondal
発行日 2023-06-26 16:22:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, hep-th, stat.ML パーマリンク