要約
粒子物理学における機械学習アーキテクチャの解釈可能性の問題には、合意された定義はなく、提案された解決策ははるかに少ないです。
これらの目標に対する最初の控えめなステップを提示し、マシンが利用する関連する物理エネルギースケールの分離と識別のための定義と対応する実用的な方法を提案します。
これは、互いの規定されたメトリックエネルギー距離内にあるすべての入力イベントを塗り付けるか平均することによって達成され、それに応じて、データスパース上で連続して有限の離散データセットで測定された量をそれに応じてレンダリングします。
このアプローチ内で、(近似)スケーリング法則は、有限のデータセットを考慮して機械が外挿する必要がある既確最小距離の分布の分析に適用される極度の価値理論の結果であることを明示的に実証することができます。
例として、クォークとグルオンジェットの識別を研究し、塗抹された尤度を構築し、解像度が減少するにつれて識別力が着実に増加することを示し、問題の真の可能性がすべてのスケールでの排出に敏感であることを示しています。
要約(オリジナル)
The problem of interpretability of machine learning architecture in particle physics has no agreed-upon definition, much less any proposed solution. We present a first modest step toward these goals by proposing a definition and corresponding practical method for isolation and identification of relevant physical energy scales exploited by the machine. This is accomplished by smearing or averaging over all input events that lie within a prescribed metric energy distance of one another and correspondingly renders any quantity measured on a finite, discrete dataset continuous over the dataspace. Within this approach, we are able to explicitly demonstrate that (approximate) scaling laws are a consequence of extreme value theory applied to analysis of the distribution of the irreducible minimal distance over which a machine must extrapolate given a finite dataset. As an example, we study quark versus gluon jet identification, construct the smeared likelihood, and show that discrimination power steadily increases as resolution decreases, indicating that the true likelihood for the problem is sensitive to emissions at all scales.
arxiv情報
著者 | Andrew J. Larkoski |
発行日 | 2025-03-10 16:35:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google